基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
2016年初,AlphaGo战胜李世石成为人工智能的里程碑事件.其核心技术深度强化学习受到人们的广泛关注和研究,取得了丰硕的理论和应用成果.并进一步研发出算法形式更为简洁的AlphaGo Zero,其采用完全不基于人类经验的自学习算法,完胜AlphaGo,再一次刷新人们对深度强化学习的认知.深度强化学习结合了深度学习和强化学习的优势,可以在复杂高维的状态动作空间中进行端到端的感知决策.本文主要介绍了从AlphaGo到Alpha-Go Zero的深度强化学习的研究进展.首先回顾对深度强化学习的成功作出突出贡献的主要算法,包括深度Q网络算法、A3C算法、策略梯度算法及其他算法的相应扩展.然后给出AlphaGo Zero的详细介绍和讨论,分析其对人工智能的巨大推动作用.并介绍了深度强化学习在游戏、机器人、自然语言处理、智能驾驶、智能医疗等领域的应用进展,以及相关资源进展.最后探讨了深度强化学习的发展展望,以及对其他潜在领域的人工智能发展的启发意义.
推荐文章
从AlphaGo到BetaGo——基于任务可完成性分析的定性人工智能的定量实现
AlphaGo
特征完备性
表征空间
任务可完成性
抗干扰
美感评价
人工智能
解读AlphaGo背后的人工智能技术
AlphaGo
深度学习
价值网络
策略网络
磁导航AGV深度强化学习路径跟踪控制方法
自动导引车
路径跟踪
强化学习
深度强化学习
分层强化学习研究进展
分层强化学习
半马尔可夫决策过程
抽象
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 深度强化学习进展:从AlphaGo到AlphaGo Zero
来源期刊 控制理论与应用 学科 工学
关键词 深度强化学习 AlphaGoZero 深度学习 强化学习 人工智能
年,卷(期) 2017,(12) 所属期刊栏目 综述与评论
研究方向 页码范围 1529-1546
页数 18页 分类号 TP273
字数 21251字 语种 中文
DOI 10.7641/CTA.2017.70808
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 赵冬斌 中国科学院自动化研究所复杂系统管理与控制国家重点实验室 58 1184 19.0 32.0
2 唐振韬 中国科学院自动化研究所复杂系统管理与控制国家重点实验室 1 51 1.0 1.0
3 邵坤 1 51 1.0 1.0
4 朱圆恒 2 56 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (62)
共引文献  (60)
参考文献  (14)
节点文献
引证文献  (51)
同被引文献  (196)
二级引证文献  (54)
1956(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(2)
  • 参考文献(0)
  • 二级参考文献(2)
1994(4)
  • 参考文献(0)
  • 二级参考文献(4)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(4)
  • 参考文献(0)
  • 二级参考文献(4)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(7)
  • 参考文献(2)
  • 二级参考文献(5)
2013(4)
  • 参考文献(1)
  • 二级参考文献(3)
2014(4)
  • 参考文献(0)
  • 二级参考文献(4)
2015(11)
  • 参考文献(3)
  • 二级参考文献(8)
2016(11)
  • 参考文献(4)
  • 二级参考文献(7)
2017(4)
  • 参考文献(4)
  • 二级参考文献(0)
2017(4)
  • 参考文献(4)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(12)
  • 引证文献(12)
  • 二级引证文献(0)
2019(56)
  • 引证文献(25)
  • 二级引证文献(31)
2020(37)
  • 引证文献(14)
  • 二级引证文献(23)
研究主题发展历程
节点文献
深度强化学习
AlphaGoZero
深度学习
强化学习
人工智能
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
控制理论与应用
月刊
1000-8152
44-1240/TP
大16开
广州市五山华南理工大学内
46-11
1984
chi
出版文献量(篇)
4979
总下载数(次)
16
总被引数(次)
72515
论文1v1指导