基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
强化学习作为一种用于解决无模型序列决策问题的方法已经有数十年的历史,但强化学习方法在处理高维变量问题时常常会面临巨大挑战.近年来,深度学习迅猛发展,使得强化学习方法为复杂高维的多智能体系统提供优化的决策策略、在充满挑战的环境中高效执行目标任务成为可能.本文综述了强化学习和深度强化学习方法的原理,提出学习系统的闭环控制框架,分析了多智能体深度强化学习中存在的若干重要问题和解决方法,包括多智能体强化学习的算法结构、环境非静态和部分可观性等问题,对所调查方法的优缺点和相关应用进行分析和讨论.最后提供多智能体深度强化学习未来的研究方向,为开发更强大、更易应用的多智能体强化学习控制系统提供一些思路.
推荐文章
基于多智能体强化学习的多AGV路径规划方法
多智能体强化学习
AGV路径规划
独立强化学习
基于GAED-MADDPG多智能体强化学习的协作策略研究
强化学习
群体协作
深度学习
群体智慧
低能核物理若干关键科学问题研究
基础科学
低能核物理
核理论
实验核物理
多智能体强化学习在城市交通网络信号控制方法中的应用综述
智能交通
交通控制
多智能体强化学习
闭环反馈
联动协调
数据驱动
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 多智能体深度强化学习的若干关键科学问题
来源期刊 自动化学报 学科
关键词 强化学习 深度强化学习 多智能体 学习系统 智能控制 决策优化
年,卷(期) 2020,(7) 所属期刊栏目 综述
研究方向 页码范围 1301-1312
页数 12页 分类号
字数 14063字 语种 中文
DOI 10.16383/j.aas.c200159
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 孙长银 东南大学自动化学院 40 378 10.0 18.0
2 穆朝絮 天津大学电气自动化与信息工程学院 4 11 1.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (161)
共引文献  (72)
参考文献  (28)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1956(1)
  • 参考文献(0)
  • 二级参考文献(1)
1981(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(2)
  • 参考文献(0)
  • 二级参考文献(2)
1994(4)
  • 参考文献(0)
  • 二级参考文献(4)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(4)
  • 参考文献(0)
  • 二级参考文献(4)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(4)
  • 参考文献(0)
  • 二级参考文献(4)
2000(4)
  • 参考文献(0)
  • 二级参考文献(4)
2001(4)
  • 参考文献(0)
  • 二级参考文献(4)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(7)
  • 参考文献(0)
  • 二级参考文献(7)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(5)
  • 参考文献(0)
  • 二级参考文献(5)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(10)
  • 参考文献(1)
  • 二级参考文献(9)
2013(18)
  • 参考文献(0)
  • 二级参考文献(18)
2014(13)
  • 参考文献(1)
  • 二级参考文献(12)
2015(24)
  • 参考文献(4)
  • 二级参考文献(20)
2016(21)
  • 参考文献(6)
  • 二级参考文献(15)
2017(23)
  • 参考文献(10)
  • 二级参考文献(13)
2018(4)
  • 参考文献(2)
  • 二级参考文献(2)
2019(9)
  • 参考文献(4)
  • 二级参考文献(5)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
强化学习
深度强化学习
多智能体
学习系统
智能控制
决策优化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
自动化学报
月刊
0254-4156
11-2109/TP
大16开
北京市海淀区中关村东路95号(北京2728信箱)
2-180
1963
chi
出版文献量(篇)
4124
总下载数(次)
26
总被引数(次)
120705
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导