基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对经典强化学习的多智能体编队存在通信和计算资源消耗大的问题,本文引入事件驱动控制机制,智能体的动作决策无须按固定周期进行,而依赖于事件驱动条件更新智能体动作.在设计事件驱动条件时,不仅考虑智能体的累积奖赏值,还引入智能体与邻居奖赏值的偏差,智能体间通过交互来寻求最优联合策略实现编队.数值仿真结果表明,基于事件驱动的强化学习多智能体编队控制算法,在保证系统性能的情况下,能有效降低多智能体的动作决策频率和资源消耗.
推荐文章
基于事件驱动的多智能体强化学习研究
事件驱动
多智能体
强化学习
分布式马尔科夫决策过程
收敛性
多智能体深度强化学习研究综述
强化学习
深度学习
多智能体系统
多智能体深度强化学习
多智能体强化学习在城市交通网络信号控制方法中的应用综述
智能交通
交通控制
多智能体强化学习
闭环反馈
联动协调
数据驱动
多智能体深度强化学习的若干关键科学问题
强化学习
深度强化学习
多智能体
学习系统
智能控制
决策优化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 事件驱动的强化学习多智能体编队控制
来源期刊 智能系统学报 学科 工学
关键词 强化学习 多智能体 事件驱动 编队控制 马尔可夫过程 集群智能 动作决策 粒子群算法
年,卷(期) 2019,(1) 所属期刊栏目
研究方向 页码范围 93-98
页数 6页 分类号 TP391.8
字数 4038字 语种 中文
DOI 10.11992/tis.201807010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 谢广明 广西科技大学电气与信息工程学院 62 518 11.0 20.0
7 高远 广西科技大学电气与信息工程学院 22 114 6.0 9.0
11 文家燕 广西科技大学电气与信息工程学院 21 40 5.0 5.0
15 徐鹏 广西科技大学电气与信息工程学院 2 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (18)
共引文献  (6)
参考文献  (11)
节点文献
引证文献  (2)
同被引文献  (2)
二级引证文献  (0)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(2)
  • 参考文献(1)
  • 二级参考文献(1)
2014(3)
  • 参考文献(0)
  • 二级参考文献(3)
2015(2)
  • 参考文献(1)
  • 二级参考文献(1)
2016(3)
  • 参考文献(1)
  • 二级参考文献(2)
2017(3)
  • 参考文献(3)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
强化学习
多智能体
事件驱动
编队控制
马尔可夫过程
集群智能
动作决策
粒子群算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
智能系统学报
双月刊
1673-4785
23-1538/TP
大16开
哈尔滨市南岗区南通大街145-1号楼
2006
chi
出版文献量(篇)
2770
总下载数(次)
11
总被引数(次)
12401
论文1v1指导