Your browser doesn't support javascript.
loading
Optimal Policy of Multiplayer Poker via Actor-Critic Reinforcement Learning.
Shi, Daming; Guo, Xudong; Liu, Yi; Fan, Wenhui.
Afiliación
  • Shi D; Department of Automation, Tsinghua University, Beijing 100084, China.
  • Guo X; Department of Automation, Tsinghua University, Beijing 100084, China.
  • Liu Y; Department of Automation, Tsinghua University, Beijing 100084, China.
  • Fan W; Department of Automation, Tsinghua University, Beijing 100084, China.
Entropy (Basel) ; 24(6)2022 May 30.
Article en En | MEDLINE | ID: mdl-35741495

Texto completo: 1 Colección: 01-internacional Base de datos: MEDLINE Tipo de estudio: Prognostic_studies Idioma: En Revista: Entropy (Basel) Año: 2022 Tipo del documento: Article País de afiliación: China Pais de publicación: Suiza

Texto completo: 1 Colección: 01-internacional Base de datos: MEDLINE Tipo de estudio: Prognostic_studies Idioma: En Revista: Entropy (Basel) Año: 2022 Tipo del documento: Article País de afiliación: China Pais de publicación: Suiza