基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
近年来,深度强化学习(Deep reinforcement learning,DRL)在诸多复杂序贯决策问题中取得巨大突破.由于融合了深度学习强大的表征能力和强化学习有效的策略搜索能力,深度强化学习已经成为实现人工智能颇有前景的学习范式.然而,深度强化学习在多Agent系统的研究与应用中,仍存在诸多困难和挑战,以StarCraft Ⅱ为代表的部分观测环境下的多Agent学习仍然很难达到理想效果.本文简要介绍了深度Q网络、深度策略梯度算法等为代表的深度强化学习算法和相关技术.同时,从多Agent深度强化学习中通信过程的角度对现有的多Agent深度强化学习算法进行归纳,将其归纳为全通信集中决策、全通信自主决策、欠通信自主决策3种主流形式.从训练架构、样本增强、鲁棒性以及对手建模等方面探讨了多Agent深度强化学习中的一些关键问题,并分析了多Agent深度强化学习的研究热点和发展前景.
推荐文章
强化学习研究综述
强化学习
多智能体
马尔可夫决策过程
利用聚类分析法改进的多Agent协作强化学习方法
多agent协作
强化学习
聚类分析
Friend-or-Foe
Q-学习
多智能体深度强化学习研究综述
强化学习
深度学习
多智能体系统
多智能体深度强化学习
深度逆向强化学习研究综述
深度学习
强化学习
深度逆向强化学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 多Agent深度强化学习综述
来源期刊 自动化学报 学科
关键词 多Agent系统 深度学习 深度强化学习 通用人工智能
年,卷(期) 2020,(12) 所属期刊栏目 综述
研究方向 页码范围 2537-2557
页数 21页 分类号
字数 语种 中文
DOI 10.16383/j.aas.c180372
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (48)
共引文献  (59)
参考文献  (21)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1956(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(2)
  • 参考文献(0)
  • 二级参考文献(2)
1994(4)
  • 参考文献(0)
  • 二级参考文献(4)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(7)
  • 参考文献(2)
  • 二级参考文献(5)
2013(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(3)
  • 参考文献(0)
  • 二级参考文献(3)
2015(11)
  • 参考文献(5)
  • 二级参考文献(6)
2016(10)
  • 参考文献(5)
  • 二级参考文献(5)
2017(6)
  • 参考文献(6)
  • 二级参考文献(0)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
多Agent系统
深度学习
深度强化学习
通用人工智能
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
自动化学报
月刊
0254-4156
11-2109/TP
大16开
北京市海淀区中关村东路95号(北京2728信箱)
2-180
1963
chi
出版文献量(篇)
4124
总下载数(次)
26
总被引数(次)
120705
论文1v1指导