作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在传统Q学习算法基础上引入多智能体系统,提出了多智能体联合Q学习算法.该算法是在同一评价函数下进行多智能体的学习,并且学习过程考虑了参与协作的所有智能体的学习结果.在RoboCup-2D足球仿真比赛中通过引入球场状态分解法减少了状态分量,采用联合学习得到的最优状态作为多智能体协作的最优动作组,有效解决了仿真中各智能体之间的传球策略及其协作问题,仿真和实验结果证明了算法的有效性和可靠性.
推荐文章
基于传球评价函数的Robocup传球策略
Robocup
传球策略
传球评价函数
基于改进的Q学习的RoboCup传球策略研究
RoboCup
神经网络
Q学习
智能体
传球策略
分布式强化学习在RoboCup中的应用
强化学习
分布式强化学习
Agent
RoboCup
基于强化学习的 RoboCup Keepaway 高层抢球策略
机器人足球
Keepaway
强化学习
抢球策略
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于联合强化学习的RoboCup-2D传球策略
来源期刊 计算机工程与应用 学科 工学
关键词 多智能体系统 联合Q学习算法 RoboCup-2D 球场状态分解法
年,卷(期) 2011,(23) 所属期刊栏目 工程与应用
研究方向 页码范围 212-216,219
页数 分类号 TP242.6
字数 4996字 语种 中文
DOI 10.3778/j.issn.1002-8331.2011.23.060
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 常晓军 西安理工大学自动化与信息工程学院 9 23 2.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (22)
共引文献  (30)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1992(2)
  • 参考文献(0)
  • 二级参考文献(2)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(4)
  • 参考文献(0)
  • 二级参考文献(4)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(4)
  • 参考文献(4)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
多智能体系统
联合Q学习算法
RoboCup-2D
球场状态分解法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导