基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
深度逆向强化学习是机器学习领域的一个新的研究热点,它针对深度强化学习的回报函数难以获取问题,提出了通过专家示例轨迹重构回报函数的方法.首先介绍了3类深度强化学习方法的经典算法;接着阐述了经典的逆向强化学习算法,包括基于学徒学习、最大边际规划、结构化分类和概率模型形式化的方法;然后对深度逆向强化学习的一些前沿方向进行了综述,包括基于最大边际法的深度逆向强化学习、基于深度Q网络的深度逆向强化学习和基于最大熵模型的深度逆向强化学习和示例轨迹非专家情况下的逆向强化学习方法等.最后总结了深度逆向强化学习在算法、理论和应用方面存在的问题和发展方向.
推荐文章
强化学习研究综述
强化学习
多智能体
马尔可夫决策过程
强化学习研究综述
强化学习
深度强化学习
元强化学习
逆向强化学习
决策优化
多智能体深度强化学习研究综述
强化学习
深度学习
多智能体系统
多智能体深度强化学习
强化学习研究综述
强化学习
部分感知
函数估计
多agent强化学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 深度逆向强化学习研究综述
来源期刊 计算机工程与应用 学科 工学
关键词 深度学习 强化学习 深度逆向强化学习
年,卷(期) 2018,(5) 所属期刊栏目 热点与综述
研究方向 页码范围 24-35
页数 12页 分类号 TP181
字数 13659字 语种 中文
DOI 10.3778/j.issn.1002-8331.1711-0289
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 何明 陆军工程大学指挥信息系统学院 6 13 2.0 3.0
2 陈希亮 陆军工程大学指挥信息系统学院 6 15 2.0 3.0
3 曹雷 陆军工程大学指挥信息系统学院 6 13 2.0 3.0
4 徐志雄 陆军工程大学指挥信息系统学院 2 12 2.0 2.0
5 李晨溪 陆军工程大学指挥信息系统学院 1 10 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (41)
共引文献  (104)
参考文献  (8)
节点文献
引证文献  (10)
同被引文献  (35)
二级引证文献  (20)
1992(2)
  • 参考文献(0)
  • 二级参考文献(2)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(3)
  • 参考文献(1)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(4)
  • 参考文献(1)
  • 二级参考文献(3)
2014(3)
  • 参考文献(0)
  • 二级参考文献(3)
2015(8)
  • 参考文献(1)
  • 二级参考文献(7)
2016(3)
  • 参考文献(1)
  • 二级参考文献(2)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(4)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(3)
  • 二级引证文献(0)
2018(3)
  • 引证文献(3)
  • 二级引证文献(0)
2019(16)
  • 引证文献(5)
  • 二级引证文献(11)
2020(11)
  • 引证文献(2)
  • 二级引证文献(9)
研究主题发展历程
节点文献
深度学习
强化学习
深度逆向强化学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
相关基金
江苏省自然科学基金
英文译名:Natural Science Foundation of Jiangsu Province
官方网址:http://www.jsnsf.gov.cn/News.aspx?a=37
项目类型:
学科类型:
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导