基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对目标驱动的视觉导航系统中由于导航的场景变化而导致智能体导航性能大大减弱的问题,提出了一种基于长短时记忆网络(Long Short-Term Memory,LSTM)的深度强化学习(Deep Reinforcement Learning,DRL)视觉导航模型.该模型通过输入当前状态和目标状态的RGB图像来实现视觉导航,在改进原有目标驱动视觉导航模型的基础上,基于历史状态信息,结合LSTM和通用后继表征(Universal Successor Representations,USR)对未来动作决策.在AI2-THOR仿真环境下进行实验,实验结果表明,所提出的模型训练智能体导航性能优异,与其他几种模型相比,平均路径长度减少约6%,平均碰撞率减少40%,模型收敛速度较快.
推荐文章
磁导航AGV深度强化学习路径跟踪控制方法
自动导引车
路径跟踪
强化学习
深度强化学习
基于深度强化学习的移动机器人导航策略研究
深度强化学习
移动机器人
导航
复杂环境
基于深度强化学习的航路点飞行冲突解脱
飞行冲突
深度强化学习
深度Q网络
航空器分离
基于深度强化学习的图像修复算法设计
图像修复
机器学习
深度强化学习
大数据
自相似
关联性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 融合LSTM的深度强化学习视觉导航
来源期刊 无线电工程 学科 工学
关键词 视觉导航 深度强化学习 长短时记忆网络 目标驱动 通用后继表征
年,卷(期) 2022,(1) 所属期刊栏目 测控遥感与导航定位|TT&C, Remote Sensing and Navigation&Positioning
研究方向 页码范围 161-167
页数 7页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1003-3106.2022.01.024
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
视觉导航
深度强化学习
长短时记忆网络
目标驱动
通用后继表征
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
无线电工程
月刊
1003-3106
13-1097/TN
大16开
河北省石家庄市174信箱215分箱
18-150
1971
chi
出版文献量(篇)
5453
总下载数(次)
12
总被引数(次)
20875
论文1v1指导