基于元强化学习的无人机自主避障与目标追踪

江未来; 吴俊; 王耀南

文献导航

搜索文章

搜索思路

钛学术文献服务平台 \
学术期刊 \
基础科学期刊 \
null期刊 \
湖南大学学报（自然科学版）期刊 \
基于元强化学习的无人机自主避障与目标追踪

基于元强化学习的无人机自主避障与目标追踪

作者：

江未来吴俊王耀南

原文服务方：湖南大学学报（自然科学版）

元强化学习

无人机

自主避障

目标追踪

路径规划

摘要：

针对传统深度强化学习在求解无人机自主避障与目标追踪任务时所存在的训练效率低、环境适应性差的问题，在深度确定性策略梯度（Deep Deterministic Policy Gradient，DDPG）算法中融入与模型无关的元学习（Model-Agnostic Meta-Learning，MAML），设计一种内外部元参数更新规则，提出了元深度确定性策略梯度（Meta-Deep Deterministic Policy Gradi⁃ent，Meta-DDPG）算法，以提升模型的收敛速度和泛化能力 . 此外，在模型预训练部分构造基本元任务集以提升实际工程中的预训练效率 . 最后，在多种测试环境下对所提算法进行了仿真验证，结果表明基本元任务集的引入可使模型预训练效果更优，Meta-DDPG 算法相比DDPG 算法在收敛特性和环境适应性方面更有优势，并且元学习方法和基本元任务集对确定性策略强化学习具有通用性.

内容分析

关键词云

关键词热度

相关文献

推荐文献

根据相关规定，获取原文需跳转至原文服务方进行注册认证身份信息

完成下面三个步骤操作后即可获取文献，阅读后请点击下方页面【继续获取】按钮

钛学术文献服务平台

学术出版新技术应用与公共服务实验室出品

原文合作方

获取文献流程

1.访问原文合作方请等待几秒系统会自动跳转至登录页，首次访问请先注册账号，填写基本信息后，点击【注册】

2.注册后进行实名认证，实名认证成功后点击【返回】

3.检查邮箱地址是否正确，若错误或未填写请填写正确邮箱地址，点击【确认支付】完成获取，文献将在1小时内发送至您的邮箱

*若已注册过原文合作方账号的用户，可跳过上述操作，直接登录后获取原文即可

点击【获取原文】按钮，跳转至合作网站。

首次获取需要在合作网站进行注册。

注册并实名认证，认证后点击【返回】按钮。

确认邮箱信息，点击【确认支付】，订单将在一小时内发送至您的邮箱。

* 若已经注册过合作网站账号，请忽略第二、三步，直接登录即可。

期刊分类
期刊（年）
期刊（期）
期刊推荐

力学化学地球物理学地质学基础科学综合大学学报天文学天文学、地球科学数学气象学海洋学物理学生物学生物科学自然地理学和测绘学自然科学总论自然科学理论与方法资源科学非线性科学与系统科学

湖南大学学报（自然科学版）2022年第3期湖南大学学报（自然科学版）2022年第5期湖南大学学报（自然科学版）2022年第6期湖南大学学报（自然科学版）2022年第7期湖南大学学报（自然科学版）2022年第8期湖南大学学报（自然科学版）2022年第10期

按字母查找期刊：

A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他

联系合作广告推广: shenyukuan@paperpass.com

篇名	基于元强化学习的无人机自主避障与目标追踪
来源期刊	湖南大学学报（自然科学版）	学科
关键词	元强化学习无人机自主避障目标追踪路径规划
年，卷（期）	2022,（6）	所属期刊栏目	计算机科学
研究方向		页码范围	101-109
页数	8页	分类号	V249.1
字数		语种	中文
DOI	10.16339/j.cnki.hdxbzkb.2022290