基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
计算机博弈程序难以处理局面估值问题.为此,结合时间差分算法和反向传播神经网络,设计一种局面估值算法BP-T(λ),实现估值函数参数的自动调整.为提高博弈训练的性能,针对开局和中局,提出分阶段设置参数值的策略.以五子棋为应用背景,实现博弈系统RenjuTD.实验结果表明,该算法可使程序的博弈水平得到较大提高.
推荐文章
中国象棋计算机博弈引擎改进
计算机博弈
博弈树搜索
人工智能
进化博弈控制问题及其计算机仿真实验
进化博弈论
进化稳定战略
计算机实验
计算机博弈的研究与发展
人工智能
计算机博弈
蒙特卡罗搜索
神经网络
遗传算法
深度学习
基于计算机试验的进化博弈研究
多人囚犯博弈
进化博弈
计算机试验
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 计算机博弈中估值算法与博弈训练的研究
来源期刊 计算机工程 学科 工学
关键词 计算机博弈 差分学习 反向传播神经网络 估值算法 增强学习 博弈训练
年,卷(期) 2012,(11) 所属期刊栏目 人工智能及识别技术
研究方向 页码范围 163-166
页数 分类号 TP18
字数 4700字 语种 中文
DOI 10.3969/j.issn.1000-3428.2012.11.050
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吕艳辉 沈阳理工大学信息科学与工程学院 24 185 7.0 13.0
2 宫瑞敏 沈阳理工大学信息科学与工程学院 2 16 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (12)
共引文献  (29)
参考文献  (6)
节点文献
引证文献  (12)
同被引文献  (31)
二级引证文献  (26)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(1)
  • 二级参考文献(0)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(2)
  • 参考文献(1)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(2)
  • 引证文献(2)
  • 二级引证文献(0)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(6)
  • 引证文献(4)
  • 二级引证文献(2)
2017(9)
  • 引证文献(3)
  • 二级引证文献(6)
2018(8)
  • 引证文献(1)
  • 二级引证文献(7)
2019(7)
  • 引证文献(1)
  • 二级引证文献(6)
2020(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
计算机博弈
差分学习
反向传播神经网络
估值算法
增强学习
博弈训练
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导