基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了解决多智能体协同控制中高维状态空间与环境部分可观测的问题,研究了中心式训练分布式执行框架在多智能体强化学习中的实现方法,以及复杂场景下传统强化学习算法,并采用带注意力机制的QMIX算法实现了协同控制.以星际争霸2学习环境(SC2LE)为基础的小场景中,将多个作战单位作为多智能体进行协同控制并加以试验验证.试验结果表明,与其他多智能体强化学习算法相比,带注意力机制的QMIX算法能够得到收敛的训练模型,可获得较好的协同控制效果.
推荐文章
基于群体协同智能聚类的大数据存储系统设计
群体协同
智能聚类
大数据
存储
基于切换拓扑的多智能体协作控制研究综述
多智能体
切换拓扑
协作控制
基于规划识别的多智能体协作研究及应用
规划识别
多智能体协作
机器人足球赛
一种基于GPGP的多智能体协同框架
GPGP(Generalized Partial Global Planning)
多智能体
协同
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 SC2LE场景下基于QMIX算法的多智能体协同控制
来源期刊 指挥信息系统与技术 学科
关键词 多智能体强化学习 QMIX算法 注意力机制 SC2LE
年,卷(期) 2021,(2) 所属期刊栏目 智能博弈对抗专题|Special Topics of Intelligent Game Confrontation
研究方向 页码范围 21-26
页数 6页 分类号 TP181
字数 语种 中文
DOI 10.15908/j.cnki.cist.2021.02.004
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (15)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(2)
  • 参考文献(1)
  • 二级参考文献(1)
2016(2)
  • 参考文献(1)
  • 二级参考文献(1)
2017(5)
  • 参考文献(0)
  • 二级参考文献(5)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
多智能体强化学习
QMIX算法
注意力机制
SC2LE
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
指挥信息系统与技术
双月刊
1674-909X
32-1818/TP
16开
南京1406信箱62分箱
28-430
2010
chi
出版文献量(篇)
1287
总下载数(次)
8
总被引数(次)
4322
论文1v1指导