基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
强化学习(reinforcement learning)是机器学习和人工智能领域的重要分支,近年来受到社会各界和企业的广泛关注.强化学习算法要解决的主要问题是,智能体如何直接与环境进行交互来学习策略.但是当状态空间维度增加时,传统的强化学习方法往往面临着维度灾难,难以取得好的学习效果.分层强化学习(hierarchical reinforcement learning)致力于将一个复杂的强化学习问题分解成几个子问题并分别解决,可以取得比直接解决整个问题更好的效果.分层强化学习是解决大规模强化学习问题的潜在途径,然而其受到的关注不高.本文将介绍和回顾分层强化学习的几大类方法.
推荐文章
分层强化学习研究进展
分层强化学习
半马尔可夫决策过程
抽象
强化学习研究综述
强化学习
多智能体
马尔可夫决策过程
分层强化学习在足球机器人中的应用
强化学习
Q_learning算法
MaxQ算法
Robocup
基于蚂蚁优化算法的分层强化学习
蚂蚁系统优化算法
强化学习
Option
瓶颈边
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 分层强化学习综述
来源期刊 智能系统学报 学科 工学
关键词 人工智能 机器学习 强化学习 分层强化学习 深度强化学习 马尔可夫决策过程 半马尔可夫决策过程 维度灾难
年,卷(期) 2017,(5) 所属期刊栏目
研究方向 页码范围 590-594
页数 5页 分类号 TP391
字数 5210字 语种 中文
DOI 10.11992/tis.201706031
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 俞扬 南京大学软件新技术国家重点实验室 31 171 7.0 11.0
2 周文吉 南京大学软件新技术国家重点实验室 1 9 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (9)
同被引文献  (15)
二级引证文献  (1)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(5)
  • 引证文献(4)
  • 二级引证文献(1)
2020(4)
  • 引证文献(4)
  • 二级引证文献(0)
研究主题发展历程
节点文献
人工智能
机器学习
强化学习
分层强化学习
深度强化学习
马尔可夫决策过程
半马尔可夫决策过程
维度灾难
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
智能系统学报
双月刊
1673-4785
23-1538/TP
大16开
哈尔滨市南岗区南通大街145-1号楼
2006
chi
出版文献量(篇)
2770
总下载数(次)
11
论文1v1指导