原文服务方: 控制理论与应用       
摘要:
深度强化学习将深度学习的感知能力和强化学习的决策能力相结合,可以直接根据输入的图像进行控制,是一种更接近人类思维方式的人工智能方法。自提出以来,深度强化学习在理论和应用方面均取得了显著的成果。尤其是谷歌深智(DeepMind)团队基于深度强化学习方法研发的计算机围棋“初弈号–AlphaGo”,在2016年3月以4:1的大比分战胜了世界围棋顶级选手李世石(Lee Sedol),成为人工智能历史上一个新里程碑。为此,本文综述深度强化学习的发展历程,兼论计算机围棋的历史,分析算法特性,探讨未来的发展趋势和应用前景,期望能为控制理论与应用新方向的发展提供有价值的参考。
推荐文章
基于深度学习的癌症计算机辅助分类诊断研究进展
深度学习
肺癌
乳腺癌
计算机辅助分类诊断
医学影像
强化学习研究综述
强化学习
多智能体
马尔可夫决策过程
深度逆向强化学习研究综述
深度学习
强化学习
深度逆向强化学习
论中职生计算机学习动机的激发
中职生
计算机教学
学习动机
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 深度强化学习综述:兼论计算机围棋的发展
来源期刊 控制理论与应用 学科
关键词 深度强化学习 初弈号 深度学习 强化学习 人工智能
年,卷(期) 2016,(6) 所属期刊栏目 综述与评论
研究方向 页码范围 701-717
页数 17页 分类号 TP273
字数 语种 中文
DOI 10.7641/CTA.2016.60173
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (47)
共引文献  (161)
参考文献  (48)
节点文献
引证文献  (118)
同被引文献  (230)
二级引证文献  (378)
1956(1)
  • 参考文献(1)
  • 二级参考文献(0)
1959(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(1)
  • 二级参考文献(0)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(5)
  • 参考文献(2)
  • 二级参考文献(3)
1994(5)
  • 参考文献(4)
  • 二级参考文献(1)
1997(5)
  • 参考文献(3)
  • 二级参考文献(2)
1998(4)
  • 参考文献(2)
  • 二级参考文献(2)
1999(3)
  • 参考文献(1)
  • 二级参考文献(2)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(3)
  • 参考文献(1)
  • 二级参考文献(2)
2003(5)
  • 参考文献(2)
  • 二级参考文献(3)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(6)
  • 参考文献(0)
  • 二级参考文献(6)
2006(7)
  • 参考文献(1)
  • 二级参考文献(6)
2007(5)
  • 参考文献(0)
  • 二级参考文献(5)
2008(6)
  • 参考文献(1)
  • 二级参考文献(5)
2009(4)
  • 参考文献(1)
  • 二级参考文献(3)
2010(4)
  • 参考文献(3)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(5)
  • 参考文献(5)
  • 二级参考文献(0)
2013(3)
  • 参考文献(3)
  • 二级参考文献(0)
2014(3)
  • 参考文献(3)
  • 二级参考文献(0)
2015(6)
  • 参考文献(6)
  • 二级参考文献(0)
2016(5)
  • 参考文献(5)
  • 二级参考文献(0)
2016(10)
  • 参考文献(5)
  • 二级参考文献(0)
  • 引证文献(5)
  • 二级引证文献(0)
2016(5)
  • 引证文献(5)
  • 二级引证文献(0)
2017(27)
  • 引证文献(15)
  • 二级引证文献(12)
2018(138)
  • 引证文献(46)
  • 二级引证文献(92)
2019(219)
  • 引证文献(42)
  • 二级引证文献(177)
2020(107)
  • 引证文献(10)
  • 二级引证文献(97)
研究主题发展历程
节点文献
深度强化学习
初弈号
深度学习
强化学习
人工智能
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
控制理论与应用
月刊
1000-8152
44-1240/TP
大16开
1984-01-01
chi
出版文献量(篇)
4979
总下载数(次)
0
总被引数(次)
72515
论文1v1指导