作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统的Q学习已被有效地应用于处理RoboCup中传球策略问题,但是它仅能简单地离散化连续的状态、动作空间。文章提出一种改进的Q学习算法,提出将神经网络应用于Q学习,系统只需学习部分状态—动作的Q值,即可进行Q学习,有效的提高收敛的速度。最后在RoboCup环境中验证这个算法,对传球成功率有所提高。
推荐文章
共享经验分布式Q-学习模型在RoboCup中的应用
共享经验
分布式Q-学习
多智能体
RoboCup
基于改进的Q学习的RoboCup传球策略研究
RoboCup
神经网络
Q学习
智能体
传球策略
改进的Q学习算法在机器人避碰中的应用
Q-学习
智能机器人
变衰减因子
分布式强化学习在RoboCup中的应用
强化学习
分布式强化学习
Agent
RoboCup
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 改进的Q学习算法及在其RoboCup中的应用
来源期刊 四川理工学院学报:自然科学版 学科 工学
关键词 RoboCup 神经网络 Q学习 智能体
年,卷(期) 2011,(4) 所属期刊栏目 信息与计算机科学
研究方向 页码范围 417-421
页数 分类号 TP18
字数 4019字 语种 中文
DOI 10.3969/j.issn.1673-1549.2011.04.014
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (2)
同被引文献  (5)
二级引证文献  (0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
RoboCup
神经网络
Q学习
智能体
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
四川理工学院学报(自然科学版)
双月刊
1673-1549
51-1687/N
四川省自贡市汇兴路学苑街180号
chi
出版文献量(篇)
2774
总下载数(次)
3
总被引数(次)
12372
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导