基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对现有多目标追踪方法通常存在学习速度慢、追踪效率低及协同追踪策略设计困难等问题,提出一种改进的多目标追踪方法.基于追踪智能体和目标智能体数量及其环境信息建立任务分配模型,运用匈牙利算法根据距离效益矩阵对其进行求解得到多个追踪智能体的任务分配情况,并以缩短目标智能体的追踪路径为优化目标进行任务分工,同时利用多智能体协同强化学习算法使多个智能体在相同环境中不断重复执行探索-积累-学习-决策过程,最终根据经验数据更新策略完成多目标追踪任务.仿真结果表明,与DDPG和MADDPG方法相比,该方法能在避免碰撞和躲避障碍物的情况下,使多个智能体通过相互协作形成针对多个运动目标的最短追踪路线.
推荐文章
基于强化学习的多智能体协作方法研究
多智能体
协作系统
强化学习
基于深度强化学习的车辆多目标协同巡航决策控制系统设计
深度强化学习
车辆多目标
协同巡航
决策控制
轨迹跟踪器
多目标解耦
协同参数
量化分析
基于博弈强化学习的多智能体协作行为寻优
多Agent博弈
动态协作寻优
改进Pareto-Q
收益分配
深度强化学习复原多目标航迹的TOC奖励函数
深度强化学习
序贯决策
Q函数
轨迹密切圆
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多智能体协同强化学习的多目标追踪方法
来源期刊 计算机工程 学科 工学
关键词 多智能体 多目标追踪 强化学习 任务分配 实时性
年,卷(期) 2020,(11) 所属期刊栏目 人工智能与模式识别
研究方向 页码范围 90-96
页数 7页 分类号 TP391.1
字数 语种 中文
DOI 10.19678/j.issn.1000-3428.0055904
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 经小川 19 41 4.0 4.0
2 贾福凯 3 3 1.0 1.0
3 王毅然 2 5 1.0 2.0
4 佟轶 2 4 1.0 2.0
5 孙宇健 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (43)
共引文献  (22)
参考文献  (11)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2012(2)
  • 参考文献(1)
  • 二级参考文献(1)
2014(3)
  • 参考文献(2)
  • 二级参考文献(1)
2015(6)
  • 参考文献(4)
  • 二级参考文献(2)
2016(2)
  • 参考文献(0)
  • 二级参考文献(2)
2017(4)
  • 参考文献(0)
  • 二级参考文献(4)
2018(8)
  • 参考文献(2)
  • 二级参考文献(6)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
多智能体
多目标追踪
强化学习
任务分配
实时性
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
论文1v1指导