原文服务方: 计算机测量与控制       
摘要:
针对两轮自平衡机器人在学习过程中遇到的主动性差和以往强化学习对单步学习效率低的问题,受心理学中内在动机理论的启发,提出一种基于内在动机的强化学习算法;该算法利用内在动机信号作为内部奖励,模拟人类心理认知机理并与外部信号一起作用于整个学习过程,提高了智能体的自学习能力,同时采用自组织神经网络进行训练,保证了算法的快速性;通过无扰动和有扰动两种仿真实验的对比,验证了基于内在动机的强化学习算法能够使两轮机器人在未知环境下通过自主学习最终达到平衡,且体现了该算法的鲁棒性和可行性.
推荐文章
基于强化学习规则的两轮机器人自平衡控制
强化学习
模糊神经网络
两轮机器人系统
平衡控制
基于Codesys的两轮机器人控制研究
两轮机器人
卡尔曼滤波
PID控制
树莓派
Codesys
基于仿生学内在动机的Q学习算法移动机器人路径规划研究
移动机器人
路径规划
内在动机
Q学习算法
引力势场
智能发育
分层强化学习在足球机器人中的应用
强化学习
Q_learning算法
MaxQ算法
Robocup
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于内在动机的强化学习算法在两轮机器人中的研究
来源期刊 计算机测量与控制 学科
关键词 内在动机 强化学习 平衡控制 鲁棒性 两轮机器人
年,卷(期) 2015,(9) 所属期刊栏目 算法、设计与应用
研究方向 页码范围 3185-3187,3191
页数 4页 分类号 TP183
字数 语种 中文
DOI 10.16526/j.cnki.11-4762/tp.2015.09.075
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李福进 河北联合大学电气工程学院 18 77 3.0 8.0
2 刘伟民 河北联合大学电气工程学院 9 36 4.0 5.0
3 任红格 河北联合大学电气工程学院 10 18 3.0 4.0
4 向迎帆 河北联合大学电气工程学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (11)
共引文献  (49)
参考文献  (6)
节点文献
引证文献  (3)
同被引文献  (0)
二级引证文献  (0)
1959(1)
  • 参考文献(1)
  • 二级参考文献(0)
1983(2)
  • 参考文献(0)
  • 二级参考文献(2)
1989(2)
  • 参考文献(0)
  • 二级参考文献(2)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(2)
  • 参考文献(1)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
内在动机
强化学习
平衡控制
鲁棒性
两轮机器人
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机测量与控制
月刊
1671-4598
11-4762/TP
大16开
北京市海淀区阜成路甲8号
1993-01-01
出版文献量(篇)
0
总下载数(次)
0
总被引数(次)
0
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导