基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
由于强大的自主学习能力,强化学习方法逐渐成为机器人导航问题的研究热点,但是复杂的未知环境对算法的运行效率和收敛速度提出了考验。提出一种新的机器人导航Q学习算法,首先用三个离散的变量来定义环境状态空间,然后分别设计了两部分奖赏函数,结合对导航达到目标有利的知识来启发引导机器人的学习过程。实验在 Simbad 仿真平台上进行,结果表明本文提出的算法很好地完成了机器人在未知环境中的导航任务,收敛性能也有其优越性。
推荐文章
未知环境下基于FSA的移动机器人导航策略
激光雷达
特征提取
有限状态自动机
移动机器人
未知远程环境下移动机器人导航的并行进化模型
未知环境
远程控制
移动机器人
并行进化
导航
基于仿生学内在动机的Q学习算法移动机器人路径规划研究
移动机器人
路径规划
内在动机
Q学习算法
引力势场
智能发育
全局环境未知时机器人导航和避障的一种新方法
导航
数据融合
预测控制
路径规划
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于未知环境状态新定义及知识启发的机器人导航Q学习算法
来源期刊 计算机系统应用 学科
关键词 强化学习 状态定义 知识启发 Simbad平台
年,卷(期) 2014,(1) 所属期刊栏目
研究方向 页码范围 149-153
页数 5页 分类号
字数 3937字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 姚明海 浙江工业大学信息工程学院 91 1088 17.0 30.0
2 张灿淋 浙江工业大学信息工程学院 3 11 2.0 3.0
3 童小龙 浙江工业大学信息工程学院 2 6 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (3)
参考文献  (5)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(3)
  • 参考文献(2)
  • 二级参考文献(1)
2014(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
强化学习
状态定义
知识启发
Simbad平台
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
总被引数(次)
57078
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导