ICML 2021] DouZero: 从零开始通过自我博弈强化学习来学打架地主 Github ...

打印 上一主题 下一主题

主题 937|帖子 937|积分 2811

ICML 2021] DouZero: 从零开始通过自我博弈强化学习来学打架地主

English README
DouZero是一个为斗地主设计的强化学习框架。斗地主十分具有挑战性。它包含合作、竞争、非完全信息、庞大的状态空间。斗地主也有非常大的动作空间,而且每一步正当的牌型会非常不一样。DouZero由快手AI平台部开发。


  • 在线演示: RLcard Showdown

回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

写过一篇

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表