基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
多Agent协作追捕问题是多Agent协调与协作研究中的一个典型问题.针对具有学习能力的单逃跑者追捕问题,提出了一种基于博弈论及Q学习的多Agent协作追捕算法.首先,建立协作追捕团队,并构建协作追捕的博弈模型;其次,通过对逃跑者策略选择的学习,建立逃跑者有限的Step-T累积奖赏的运动轨迹,并把运动轨迹调整到追捕者的策略集中;最后,求解协作追捕博弈得到Nash均衡解,每个Agent执行均衡策略完成追捕任务.同时,针对在求解中可能存在多个均衡解的问题,加入了虚拟行动行为选择算法来选择最优的均衡策略.C#仿真实验表明,所提算法能够有效地解决障碍环境中单个具有学习能力的逃跑者的追捕问题,实验数据对比分析表明该算法在同等条件下的追捕效率要优于纯博弈或纯学习的追捕算法.
推荐文章
基于联合博弈的多Agent学习
Agent
强化学习
联合博弈
MAS
基于量子理论及蚁群算法的多Agent Q学习
多Agent系统
协作
量子计算
Q-学习
均衡解
蚁群算法
一种基于博弈论的多Agent交互模型
博弈论
多Agent系统
交互
集体理性约束的Agent协作强化学习
多Agent系统
强化学习
集体理性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于博弈论及Q学习的多Agent协作追捕算法
来源期刊 计算机应用 学科 工学
关键词 多Agent 协作追捕 博弈论 Q学习 强化学习
年,卷(期) 2020,(6) 所属期刊栏目 人工智能
研究方向 页码范围 1613-1620
页数 8页 分类号 TP24
字数 11203字 语种 中文
DOI 10.11772/j.issn.1001-9081.2019101783
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郑延斌 河南师范大学计算机与信息工程学院 64 460 11.0 18.0
3 陶雪丽 河南师范大学计算机与信息工程学院 19 62 5.0 6.0
6 樊文鑫 河南师范大学计算机与信息工程学院 6 10 2.0 3.0
7 韩梦云 河南师范大学计算机与信息工程学院 6 10 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (47)
共引文献  (12)
参考文献  (14)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(3)
  • 参考文献(1)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(7)
  • 参考文献(0)
  • 二级参考文献(7)
2011(5)
  • 参考文献(1)
  • 二级参考文献(4)
2012(5)
  • 参考文献(1)
  • 二级参考文献(4)
2013(6)
  • 参考文献(0)
  • 二级参考文献(6)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(5)
  • 参考文献(3)
  • 二级参考文献(2)
2016(3)
  • 参考文献(2)
  • 二级参考文献(1)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(4)
  • 参考文献(1)
  • 二级参考文献(3)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
多Agent
协作追捕
博弈论
Q学习
强化学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
总被引数(次)
209512
论文1v1指导