基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对强化学习(RL)中状态空间过大所引起的学习时间过长或算法难于收敛等问题,提出了一种基于矢量量化(VQ)技术的表格型强化学习方法--VQRL方法,该方法用矢量量化器的码书矢量来逼近强化学习的状态空间,从而有效地解决了强化学习的状态空间分割问题,并提高了学习的收敛速度.同时根据等失真理论将一种失真敏感自组织特征映射(SOFM)神经网络用于矢量量化,以达到更好的强化学习状态空间泛化性能.将此方法应用于反应式移动机器人的行为学习的实验验证了此方法的有效性,实验表明,此方法能够较好地解决复杂未知环境的机器人导航问题.
推荐文章
强化学习在足球机器人基本动作学习中的应用
强化学习
机器人足球比赛
行为学习
T-S模糊神经网络
基于人工情感的Q-学习算法在机器人行为决策中的应用
强化学习
Q-学习算法
人工情感
机器人
最优控制策略
分层强化学习在足球机器人中的应用
强化学习
Q_learning算法
MaxQ算法
Robocup
基于强化学习的智能机器人避碰方法研究
强化学习
智能机器人
避碰
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于矢量量化的强化学习及其在机器人行为学习中的应用
来源期刊 高技术通讯 学科 工学
关键词 强化学习(RL) 矢量量化(VQ) 码书 Q(λ)学习 自组织特征映射
年,卷(期) 2011,(2) 所属期刊栏目 先进制造与自动化技术
研究方向 页码范围 179-184
页数 分类号 TP18
字数 6185字 语种 中文
DOI 10.3772/j.issn.1002-0470.2011.02.012
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐心和 东北大学信息科学与工程学院 295 7536 42.0 73.0
2 段勇 沈阳工业大学信息科学与工程学院 39 307 10.0 15.0
3 张永赫 沈阳工业大学信息科学与工程学院 2 6 2.0 2.0
4 伊婧 沈阳工业大学信息科学与工程学院 2 5 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (17)
共引文献  (6)
参考文献  (5)
节点文献
引证文献  (4)
同被引文献  (2)
二级引证文献  (0)
1980(2)
  • 参考文献(0)
  • 二级参考文献(2)
1985(2)
  • 参考文献(0)
  • 二级参考文献(2)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(2)
  • 参考文献(0)
  • 二级参考文献(2)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(2)
  • 参考文献(1)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
强化学习(RL)
矢量量化(VQ)
码书
Q(λ)学习
自组织特征映射
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
高技术通讯
月刊
1002-0470
11-2770/N
大16开
北京市三里河路54号
82-516
1991
chi
出版文献量(篇)
5099
总下载数(次)
14
总被引数(次)
39217
论文1v1指导