基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对在具有动态因素且视觉丰富环境中的导航问题,受路标机制空间记忆方式启发,提出一种可同步学习目标导向行为和记忆空间结构的视觉导航方法.首先,为直接从原始输入中学习控制策略,以深度强化学习为基本导航框架,同时添加碰撞预测作为模型辅助任务;然后,在智能体学习导航过程中,利用时间相关性网络祛除冗余观测及寻找导航节点,实现通过情景记忆递增描述环境结构;最后,将空间拓扑地图作为路径规划模块集成到模型中,并结合动作网络用于获取更加通用的导航方法.实验在3D仿真环境DMlab中进行,实验结果表明,本文方法可从视觉输入中学习目标导向行为,在所有测试环境中均展现出更高效的学习方法和导航策略,同时减少构建地图所需数据量;而在包含动态堵塞的环境中,该模型可使用拓扑地图动态规划路径,从而引导绕路行为完成导航任务,展现出良好的环境适应性.
推荐文章
结合拓扑和方位的定性空间推理方法
定性空间推理
约束满足问题
拓扑
方位
基于视觉的拓扑特征提取
立体轮廓提取
降维投影
拓扑映射
拓扑特征
旅游景区导向标识的系统结构及空间导航模式分析
旅游景区
导向标识
标识结构
导航模式
基于单目视觉的空间非合作目标相对姿态估计方法
单目视觉
空间非合作目标
相对姿态估计
姿态子空间
动态规划
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于目标导向行为和空间拓扑记忆的视觉导航方法
来源期刊 计算机学报 学科
关键词 目标导向行为 深度强化学习 碰撞预测 时间相关性网络 空间拓扑地图 动作网络
年,卷(期) 2021,(3) 所属期刊栏目 人工智能
研究方向 页码范围 594-608
页数 15页 分类号
字数 语种 中文
DOI 10.11897/SP.J.1016.2021.00594
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (87)
共引文献  (107)
参考文献  (18)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1948(1)
  • 参考文献(1)
  • 二级参考文献(0)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1976(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(1)
  • 参考文献(1)
  • 二级参考文献(0)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(5)
  • 参考文献(0)
  • 二级参考文献(5)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(4)
  • 参考文献(1)
  • 二级参考文献(3)
2006(5)
  • 参考文献(1)
  • 二级参考文献(4)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(6)
  • 参考文献(1)
  • 二级参考文献(5)
2013(7)
  • 参考文献(0)
  • 二级参考文献(7)
2014(9)
  • 参考文献(1)
  • 二级参考文献(8)
2015(16)
  • 参考文献(2)
  • 二级参考文献(14)
2016(5)
  • 参考文献(1)
  • 二级参考文献(4)
2017(4)
  • 参考文献(2)
  • 二级参考文献(2)
2018(3)
  • 参考文献(2)
  • 二级参考文献(1)
2019(3)
  • 参考文献(3)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
目标导向行为
深度强化学习
碰撞预测
时间相关性网络
空间拓扑地图
动作网络
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
总被引数(次)
187004
论文1v1指导