基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
深度强化学习是人工智能领域的一个新的研究热点.它以一种通用的形式将深度学习的感知能力与强化学习的决策能力相结合,并能够通过端对端的学习方式实现从原始输入到输出的直接控制.自提出以来,在许多需要感知高维度原始输入数据和决策控制的任务中,深度强化学习方法已经取得了实质性的突破.该文首先阐述了三类主要的深度强化学习方法,包括基于值函数的深度强化学习、基于策略梯度的深度强化学习和基于搜索与监督的深度强化学习;其次对深度强化学习领域的一些前沿研究方向进行了综述,包括分层深度强化学习、多任务迁移深度强化学习、多智能体深度强化学习、基于记忆与推理的深度强化学习等.最后总结了深度强化学习在若干领域的成功应用和未来发展趋势.
推荐文章
强化学习研究综述
强化学习
多智能体
马尔可夫决策过程
深度逆向强化学习研究综述
深度学习
强化学习
深度逆向强化学习
多智能体深度强化学习研究综述
强化学习
深度学习
多智能体系统
多智能体深度强化学习
强化学习研究综述
强化学习
深度强化学习
元强化学习
逆向强化学习
决策优化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 深度强化学习综述
来源期刊 计算机学报 学科 工学
关键词 人工智能 深度学习 强化学习 深度强化学习
年,卷(期) 2018,(1) 所属期刊栏目 人工智能
研究方向 页码范围 1-27
页数 27页 分类号 TP18
字数 28034字 语种 中文
DOI 10.11897/SP.J.1016.2018.00001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘全 苏州大学计算机科学与技术学院 99 1053 16.0 29.0
2 徐进 苏州大学计算机科学与技术学院 16 289 5.0 16.0
3 钟珊 苏州大学计算机科学与技术学院 8 185 2.0 8.0
4 翟建伟 1 178 1.0 1.0
5 章宗长 1 178 1.0 1.0
6 周倩 1 178 1.0 1.0
7 章鹏 1 178 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (48)
共引文献  (705)
参考文献  (25)
节点文献
引证文献  (178)
同被引文献  (377)
二级引证文献  (190)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(3)
  • 参考文献(1)
  • 二级参考文献(2)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(1)
  • 二级参考文献(1)
1998(5)
  • 参考文献(0)
  • 二级参考文献(5)
1999(2)
  • 参考文献(1)
  • 二级参考文献(1)
2000(5)
  • 参考文献(1)
  • 二级参考文献(4)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(4)
  • 参考文献(1)
  • 二级参考文献(3)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(3)
  • 参考文献(1)
  • 二级参考文献(2)
2006(5)
  • 参考文献(1)
  • 二级参考文献(4)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(5)
  • 参考文献(2)
  • 二级参考文献(3)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(5)
  • 参考文献(1)
  • 二级参考文献(4)
2011(5)
  • 参考文献(1)
  • 二级参考文献(4)
2012(2)
  • 参考文献(1)
  • 二级参考文献(1)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(4)
  • 参考文献(3)
  • 二级参考文献(1)
2015(3)
  • 参考文献(3)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(36)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(31)
  • 二级引证文献(5)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(36)
  • 引证文献(31)
  • 二级引证文献(5)
2019(199)
  • 引证文献(101)
  • 二级引证文献(98)
2020(132)
  • 引证文献(45)
  • 二级引证文献(87)
研究主题发展历程
节点文献
人工智能
深度学习
强化学习
深度强化学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导