原文服务方: 湖南大学学报(自然科学版)       
摘要:
针对传统深度强化学习在求解无人机自主避障与目标追踪任务时所存在的训练效率低、环境适应性差的问题,在深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法中融入与模型无关的元学习(Model-Agnostic Meta-Learning,MAML),设计一种内外部元参数更新规则,提出了元深度确定性策略梯度(Meta-Deep Deterministic Policy Gradi⁃ent,Meta-DDPG)算法,以提升模型的收敛速度和泛化能力 . 此外,在模型预训练部分构造基本元任务集以提升实际工程中的预训练效率 . 最后,在多种测试环境下对所提算法进行了仿真验证,结果表明基本元任务集的引入可使模型预训练效果更优,Meta-DDPG 算法相比DDPG 算法在收敛特性和环境适应性方面更有优势,并且元学习方法和基本元任务集对确定性策略强化学习具有通用性.
推荐文章
基于自抗扰技术的无人机自主避障研究
无人机
自主避障
自抗扰控制器
四旋翼无人机自主避障系统的设计与实现
无人机
四旋翼
自主导航
避障
定位
超声波测距
基于双目视觉的无人机避障之研究
无人机
自主快速避障
双目视觉
深度信息
基于改进人工势场的无人机编队避障控制研究
人工势场方法
局部最小值
虚拟长机
最优路径
无人机编队避障
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于元强化学习的无人机自主避障与目标追踪
来源期刊 湖南大学学报(自然科学版) 学科
关键词 元强化学习 无人机 自主避障 目标追踪 路径规划
年,卷(期) 2022,(6) 所属期刊栏目 计算机科学
研究方向 页码范围 101-109
页数 8页 分类号 V249.1
字数 语种 中文
DOI 10.16339/j.cnki.hdxbzkb.2022290
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
元强化学习
无人机
自主避障
目标追踪
路径规划
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
湖南大学学报(自然科学版)
月刊
1674-2974
43-1061/N
16开
1956-01-01
chi
出版文献量(篇)
4768
总下载数(次)
0
总被引数(次)
41941
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导