Optimal Policy of Multiplayer Poker via Actor-Critic Reinforcement Learning.

Shi, Daming; Guo, Xudong; Liu, Yi; Fan, Wenhui

Shi, Daming; Guo, Xudong; Liu, Yi; Fan, Wenhui.

Afiliación

Shi D; Department of Automation, Tsinghua University, Beijing 100084, China.
Guo X; Department of Automation, Tsinghua University, Beijing 100084, China.
Liu Y; Department of Automation, Tsinghua University, Beijing 100084, China.
Fan W; Department of Automation, Tsinghua University, Beijing 100084, China.

Entropy (Basel) ; 24(6)2022 May 30.

Article en En | MEDLINE | ID: mdl-35741495

Palabras clave

Actor-Critic; multi-agent; multi-player; optimal policy; poker; reinforcement learning

Texto completo

Añadir a Mi BVS

Imprimir

XML

PubMed Links

Buscar en Google

Texto completo: 1 Colección: 01-internacional Base de datos: MEDLINE Tipo de estudio: Prognostic_studies Idioma: En Revista: Entropy (Basel) Año: 2022 Tipo del documento: Article País de afiliación: China Pais de publicación: Suiza

Texto completo

Añadir a Mi BVS

Imprimir

XML

PubMed Links

Buscar en Google