基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支.该文首先介绍强化学习的原理和结构;其次构造一个二维分类图,分别在马尔可夫环境和非马尔可夫环境下讨论最优搜索型和经验强化型两类算法;然后结合近年来的研究综述了强化学习技术的核心问题,包括部分感知、函数估计、多agent强化学习,以及偏差技术;最后还简要介绍强化学习的应用情况和未来的发展方向.
推荐文章
强化学习研究综述
强化学习
多智能体
马尔可夫决策过程
深度逆向强化学习研究综述
深度学习
强化学习
深度逆向强化学习
强化学习研究综述
强化学习
深度强化学习
元强化学习
逆向强化学习
决策优化
多智能体深度强化学习研究综述
强化学习
深度学习
多智能体系统
多智能体深度强化学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 强化学习研究综述
来源期刊 自动化学报 学科 工学
关键词 强化学习 部分感知 函数估计 多agent强化学习
年,卷(期) 2004,(1) 所属期刊栏目 综述与评论
研究方向 页码范围 86-100
页数 15页 分类号 TP181
字数 11421字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈世福 南京大学计算机软件新技术国家重点实验室 169 4351 32.0 60.0
2 高阳 南京大学计算机软件新技术国家重点实验室 77 1645 20.0 39.0
3 陆鑫 南京大学计算机软件新技术国家重点实验室 6 553 5.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (27)
参考文献  (11)
节点文献
引证文献  (401)
同被引文献  (173)
二级引证文献  (816)
1959(1)
  • 参考文献(1)
  • 二级参考文献(0)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(3)
  • 参考文献(3)
  • 二级参考文献(0)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(2)
  • 参考文献(2)
  • 二级参考文献(0)
1999(2)
  • 参考文献(1)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2004(1)
  • 引证文献(1)
  • 二级引证文献(0)
2005(14)
  • 引证文献(14)
  • 二级引证文献(0)
2006(31)
  • 引证文献(19)
  • 二级引证文献(12)
2007(57)
  • 引证文献(37)
  • 二级引证文献(20)
2008(55)
  • 引证文献(32)
  • 二级引证文献(23)
2009(74)
  • 引证文献(33)
  • 二级引证文献(41)
2010(52)
  • 引证文献(21)
  • 二级引证文献(31)
2011(82)
  • 引证文献(34)
  • 二级引证文献(48)
2012(61)
  • 引证文献(23)
  • 二级引证文献(38)
2013(67)
  • 引证文献(27)
  • 二级引证文献(40)
2014(81)
  • 引证文献(29)
  • 二级引证文献(52)
2015(69)
  • 引证文献(17)
  • 二级引证文献(52)
2016(87)
  • 引证文献(23)
  • 二级引证文献(64)
2017(98)
  • 引证文献(19)
  • 二级引证文献(79)
2018(165)
  • 引证文献(26)
  • 二级引证文献(139)
2019(167)
  • 引证文献(35)
  • 二级引证文献(132)
2020(56)
  • 引证文献(11)
  • 二级引证文献(45)
研究主题发展历程
节点文献
强化学习
部分感知
函数估计
多agent强化学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
自动化学报
月刊
0254-4156
11-2109/TP
大16开
北京市海淀区中关村东路95号(北京2728信箱)
2-180
1963
chi
出版文献量(篇)
4124
总下载数(次)
26
总被引数(次)
120705
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
国家重点基础研究发展计划(973计划)
英文译名:National Basic Research Program of China
官方网址:http://www.973.gov.cn/
项目类型:
学科类型:农业
论文1v1指导