ICML 2021] DouZero: 从零开始通过自我博弈强化学习来学打架地主 Github
ICML 2021] DouZero: 从零开始通过自我博弈强化学习来学打架地主English README
DouZero是一个为斗地主设计的强化学习框架。斗地主十分具有挑战性。它包含合作、竞争、非完全信息、庞大的状态空间。斗地主也有非常大的动作空间,而且每一步正当的牌型会非常不一样。DouZero由快手AI平台部开发。
[*]在线演示: RLcard Showdown
[*]
页:
[1]