基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
一方面,随着深度强化学习理论和应用研究不断深入,其在游戏、机器人控制、对话系统、自动驾驶等领域发挥重要作用;另一方面,深度强化学习受到探索-利用困境、奖励稀疏、样本采集困难、稳定性较差等问题的限制,存在很多不足.面对这些问题,研究者们提出各种各样的解决方法,新的理论进一步推动深度强化学习的发展,在弥补缺陷的同时扩展强化学习的研究领域,延伸出模仿学习、分层强化学习、元学习等新的研究方向.文中从深度强化学习的理论、困难、应用及发展前景等方面对其进行探讨.
推荐文章
强化学习理论、算法及应用
强化学习
瞬时差分法
Q-学习
自适应启发评价
智能控制系统
行为主义学习理论及其对护理教育的启示
行为主义学习理论
护理教育
自主学习能力
强化学习理论在电力系统中的应用及展望
人工智能
强化学习
马尔可夫决策过程
随机最优控制
电力系统
强化学习研究综述
强化学习
多智能体
马尔可夫决策过程
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 深度强化学习理论及其应用综述
来源期刊 模式识别与人工智能 学科 工学
关键词 深度强化学习 马尔科夫决策过程 探索-利用困境 稀疏奖励
年,卷(期) 2019,(1) 所属期刊栏目 “共融机器人”专辑
研究方向 页码范围 67-81
页数 15页 分类号 TP181
字数 16856字 语种 中文
DOI 10.16451/j.cnki.issn1003-6059.201901009
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郑南宁 西安交通大学人工智能与机器人研究所 188 3039 29.0 46.0
2 兰旭光 西安交通大学人工智能与机器人研究所 15 136 6.0 11.0
3 万里鹏 西安交通大学人工智能与机器人研究所 2 14 1.0 2.0
4 张翰博 西安交通大学人工智能与机器人研究所 1 14 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (16)
节点文献
引证文献  (14)
同被引文献  (138)
二级引证文献  (15)
1952(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(2)
  • 参考文献(2)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(3)
  • 参考文献(3)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(9)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(7)
  • 二级引证文献(2)
2019(9)
  • 引证文献(7)
  • 二级引证文献(2)
2020(20)
  • 引证文献(7)
  • 二级引证文献(13)
研究主题发展历程
节点文献
深度强化学习
马尔科夫决策过程
探索-利用困境
稀疏奖励
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
模式识别与人工智能
月刊
1003-6059
34-1089/TP
16开
中国科学院合肥智能机械研究所安徽合肥董铺岛合肥1130信箱
26-69
1989
chi
出版文献量(篇)
2928
总下载数(次)
8
总被引数(次)
30919
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导