原文服务方: 自动化与仪表       
摘要:
为了提高经典强化学习算法在机器人行为最优控制策略中学习的效率和收敛速度,在利用环境模型提高强化学习速度方法的基础上,将人类情感具有的趋利避害生存机理应用于环境模型经验知识的学习中,提出了基于人工情感的Q-学习算法,并将该算法应用于机器人的行为决策.在有障碍的二维栅格环境下对机器人路径寻优进行了仿真测试,仿真实验结果表明该算法较基于环境模型的Q-学习算法具有更高的学习效率和收敛速度.其改进算法对于提高机器人自主决策能力具有较高的理论意义及推广应用价值.
推荐文章
基于人工情感与Q学习的机器人行为决策
自主移动机器人
人工情感
强化学习
基于人工情感与CMAC网络的机器人行为学习
人工情感
CMAC网络
机器学习
基于Q-学习和行为树的CGF空战行为决策
空战决策
人工智能
行为树
Q-学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于人工情感的Q-学习算法在机器人行为决策中的应用
来源期刊 自动化与仪表 学科
关键词 强化学习 Q-学习算法 人工情感 机器人 最优控制策略
年,卷(期) 2015,(7) 所属期刊栏目 专题研究
研究方向 页码范围 13-16,48
页数 5页 分类号 TP273.22
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 谷学静 华北理工大学电气工程学院 11 14 3.0 3.0
2 高贝贝 华北理工大学电气工程学院 1 5 1.0 1.0
3 朱朝月 华北理工大学电气工程学院 4 11 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (33)
共引文献  (213)
参考文献  (7)
节点文献
引证文献  (5)
同被引文献  (16)
二级引证文献  (2)
1959(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(4)
  • 参考文献(0)
  • 二级参考文献(4)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(4)
  • 参考文献(0)
  • 二级参考文献(4)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(6)
  • 参考文献(1)
  • 二级参考文献(5)
2003(6)
  • 参考文献(0)
  • 二级参考文献(6)
2004(4)
  • 参考文献(1)
  • 二级参考文献(3)
2005(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(2)
  • 参考文献(2)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(2)
  • 引证文献(0)
  • 二级引证文献(2)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
强化学习
Q-学习算法
人工情感
机器人
最优控制策略
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
自动化与仪表
月刊
1001-9944
12-1148/TP
大16开
1981-01-01
chi
出版文献量(篇)
3994
总下载数(次)
0
总被引数(次)
18195
论文1v1指导