基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对传统深度强化学习中移动机器人在稀疏奖励环境下只有在规定时间步内到达目标位置才能得到积极奖励,中间过程的每一步都是负面奖励的路径规划问题.提出了基于改进深度Q网络的路径规划方法,在移动机器人在探索过程中,对以真实目标为条件的轨迹进行采样,在经验回放过程中,把移动机器人已经到达的状态来代替真正的目标,这样移动机器人可以获得足够的积极奖励信号来开始学习.通过深度卷积神经网络模型,将原始RGB图像作为输入,通过端对端的方法训练,利用置信区间上界探索策略和小批量样本的方法训练神经网络参数,最后得到上、下、左、右4个动作的Q值.在相同的仿真环境中结果表明,该算法提升了采样效率,训练迭代更快,并且更容易收敛,避开障碍物到达终点的成功率增加40%左右,一定程度上解决了稀疏奖励带来的问题.
推荐文章
基于深度强化学习的移动机器人导航策略研究
深度强化学习
移动机器人
导航
复杂环境
未知动态环境中基于分层强化学习的移动机器人路径规划
移动机器人
未知动态环境
路径规划
分层强化学习
移动机器人路径规划综述
移动机器人
全局路径规划
局部路径规划
智能算法
移动机器人改进人工势场的路径规划方法研究
移动机器人
路径规划
改进人工势场算法
斥力函数
局部极小值
虚拟目标点
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于改进深度强化学习的移动机器人路径规划
来源期刊 电子测量技术 学科 工学
关键词 深度强化学习 路径规划 稀疏奖励 移动机器人 后见经验回放
年,卷(期) 2021,(22) 所属期刊栏目 研究与设计|Research and Design
研究方向 页码范围 19-24
页数 6页 分类号 TP242
字数 语种 中文
DOI 10.19651/j.cnki.emt.2107490
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
深度强化学习
路径规划
稀疏奖励
移动机器人
后见经验回放
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子测量技术
半月刊
1002-7300
11-2175/TN
大16开
北京市东城区北河沿大街79号
2-336
1977
chi
出版文献量(篇)
9342
总下载数(次)
50
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导