原文服务方: 湖南大学学报(自然科学版)       
摘要:
针对传统深度强化学习在求解无人机自主避障与目标追踪任务时所存在的训练效率低、环境适应性差的问题,在深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法中融入与模型无关的元学习(Model-Agnostic Meta-Learning,MAML),设计一种内外部元参数更新规则,提出了元深度确定性策略梯度(Meta-Deep Deterministic Policy Gradi⁃ent,Meta-DDPG)算法,以提升模型的收敛速度和泛化能力 . 此外,在模型预训练部分构造基本元任务集以提升实际工程中的预训练效率 . 最后,在多种测试环境下对所提算法进行了仿真验证,结果表明基本元任务集的引入可使模型预训练效果更优,Meta-DDPG 算法相比DDPG 算法在收敛特性和环境适应性方面更有优势,并且元学习方法和基本元任务集对确定性策略强化学习具有通用性.
推荐文章
基于强化学习的旋翼无人机智能追踪方法
智能追踪
强化学习
旋翼无人机
视觉伺服
四旋翼无人机自主避障系统的设计与实现
无人机
四旋翼
自主导航
避障
定位
超声波测距
基于改进人工势场的无人机预设航线避障研究
预设航线
无人机(UAV)
改进人工势场法
三维避障
Adams仿真
四旋翼无人机自主避障系统的设计与实现
无人机
四旋翼
自主导航
避障
定位
超声波测距
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于元强化学习的无人机自主避障与目标追踪
来源期刊 湖南大学学报(自然科学版) 学科 航空航天
关键词 元强化学习 无人机 自主避障 目标追踪 路径规划
年,卷(期) 2022,(6) 所属期刊栏目 计算机科学
研究方向 页码范围 101-109
页数 8页 分类号 V249.1
字数 语种 中文
DOI 10.16339/j.cnki.hdxbzkb.2022290
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
元强化学习
无人机
自主避障
目标追踪
路径规划
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
湖南大学学报(自然科学版)
月刊
1674-2974
43-1061/N
16开
1956-01-01
chi
出版文献量(篇)
4654
总下载数(次)
0
总被引数(次)
41941
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导