基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
作为非完备信息博弈的典型代表,德州扑克一直是人工智能领域内的难题.尤其在多人无限注德州扑克中,博弈策略的制定需要考虑诸多复杂因素,加上其解空间巨大,使问题极具挑战.一般有两种思路解决之:第一种是基于博弈论的方法,通过搜索博弈树、寻找纳什均衡点得到最佳策略;第二种是基于知识的方法,通过学习人类玩家的行动来制定博弈策略.该文的方法属于后者:提出了一种基于牌型预测的德州扑克博弈方法.该方法的基本思想是模拟人类玩家的“读牌”能力.读牌是德州扑克对抗中的重要部分,即根据对手表现出的即时信息及过往的行为习惯,判断对手手牌的大致分布甚至精确牌型.读牌之所以可行,是因为随着牌局发展,对手会进行多次行动,而这些行动往往体现了其手牌信息.文章从非完备信息博弈的角度出发,提出了一套完整的博弈框架,并讨论框架的适用性.随后,将该框架具体应用于德州扑克,将研究重点放在未知信息集的预测上,并采用蒙特卡洛方法计算胜率、得出决策.文章详细地阐述了该方法的设计思想和实现细节,为多人无限注德州扑克程序的设计提供了宝贵的参考.该文是首篇全面论述并设计实现了基于对手手牌预测的多人(超过三人)无限注德州扑克程序的论文.在对手牌型预测上,该文程序比马尔可夫模型的预测精度平均高出6.65%.在博弈性能上,选择2015年华为软件精英挑战赛上的七个程序进行比较,采用锦标赛赛制(允许一次后续买入).两人局比赛的平均胜率为89%,八人局比赛的平均名次为1.74.同时在筹码胜负、坚持局数等多项指标上均取得最好成绩.
推荐文章
“扑克+好书推荐”主题扑克牌的设计与使用
“跨学科融合”
“扑克+”课程
“扑克+好书推荐”
主题扑克牌
游戏
阅读兴趣和习惯
规则意识
开发英语主题扑克牌,辅助小学英语教学
扑克牌
'扑克+英语'
跨学科
游戏化教学
“会计扑克牌”的设计及其在教学中的应用研究
兴趣
会计扑克牌
设计
会计教学
一种德州扑克的牌力评估方法
牌力值
牌力评估
德州扑克
蒙特卡洛
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于手牌预测的多人无限注德州扑克博弈方法
来源期刊 计算机学报 学科 工学
关键词 非完备信息博弈 人工智能 德州扑克 手牌预测 蒙特卡洛
年,卷(期) 2018,(1) 所属期刊栏目 人工智能
研究方向 页码范围 47-64
页数 18页 分类号 TP18
字数 17116字 语种 中文
DOI 10.11897/SP.J.1016.2018.00047
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李翔 浙江大学计算机科学与技术学院 20 216 6.0 14.0
2 姜晓红 浙江大学计算机科学与技术学院 15 464 7.0 15.0
3 陈英芝 浙江大学计算机科学与技术学院 1 4 1.0 1.0
4 包友军 浙江大学计算机科学与技术学院 1 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (4)
同被引文献  (12)
二级引证文献  (0)
1950(1)
  • 参考文献(1)
  • 二级参考文献(0)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
2020(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
非完备信息博弈
人工智能
德州扑克
手牌预测
蒙特卡洛
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
论文1v1指导