基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文章结合深度神经网络与差分学习,在苏拉卡尔塔棋博弈中引入人工神经元为棋子的移动估值,并结合差分学习得到最有价值的棋子移动.神经网络的输入为棋局,输出为棋子的价值估计,之后用它们来指导即时差分学习(TD).每出现一个局面,使用??贪婪法来选择新的动作和更新价值函数,从而使博弈效果越来越好.
推荐文章
实现苏拉卡尔塔棋网络博弈平台的吃子算法
网络博弈平台
存储结构
棋局
基于中心差分扩展卡尔曼滤波的电源频率估计
飞机供电系统
中心差分扩展卡尔曼滤波算法
频率估计
用于弹道目标跟踪的有限差分扩展卡尔曼滤波算法
弹道目标跟踪
扩展卡尔曼滤波
无味卡尔曼滤波
有限差分
基于抗差卡尔曼滤波的BD/MEMS紧耦合算法研究
无缝定位
BD
紧耦合
卡尔曼滤波
抗差卡尔曼滤波
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于苏拉卡尔塔棋的差分学习算法研究
来源期刊 无线互联科技 学科
关键词 神经网络 差分学习 损失函数
年,卷(期) 2021,(12) 所属期刊栏目 实验研究
研究方向 页码范围 107-110
页数 4页 分类号
字数 语种 中文
DOI 10.3969/j.issn.1672-6944.2021.12.051
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
神经网络
差分学习
损失函数
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
无线互联科技
半月刊
1672-6944
32-1675/TN
16开
江苏省南京市
2004
chi
出版文献量(篇)
18145
总下载数(次)
78
总被引数(次)
27320
论文1v1指导