原文服务方: 航空计算技术       
摘要:
无人机近些年来发展迅速,但无人机自主导航由于难以同时观测、定位、决策和行动而面临重大挑战。针对无人机三维环境下的自主导航决策,提出了一种高效的状态分解深度确定性策略梯度算法。基于深度确定性策略梯度(Deep Deterministic Policy Gradient, DDPG)算法,根据自身状态提出了一种新的状态分解方法,即对感知相关状态和自身相关状态分别使用两个子网络,以建立更合适的行动者网络,并分化经验池的PM((Prioritized Memory)-DDPG方法。通过虚拟引擎中的airsim平台下进行三维环境搭建并训练。实验证明,提出的PM-DDPG算法能有效提高无人机在三维复杂环境中的导航性能,较传统DDPG,TD3算法在收敛速度,训练无人机到达目标点的效率方面均有更好表现。
推荐文章
基于强化学习的智能机器人避碰方法研究
强化学习
智能机器人
避碰
基于深度强化学习的服务功能链映射算法
网络功能虚拟化
服务功能链
深度强化学习
网络时延
网络运维开销
基于深度强化学习的车辆多目标协同巡航决策控制系统设计
深度强化学习
车辆多目标
协同巡航
决策控制
轨迹跟踪器
多目标解耦
协同参数
量化分析
基于深度强化学习的航路点飞行冲突解脱
飞行冲突
深度强化学习
深度Q网络
航空器分离
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于深度强化学习的状态分解避
来源期刊 航空计算技术 学科 工学
关键词 深度强化学习;DDPG;无人机;避障
年,卷(期) 2025,(1) 所属期刊栏目 计算方法
研究方向 页码范围 5-10
页数 6页 分类号
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2025(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
深度强化学习;DDPG;无人机;避障
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
航空计算技术
双月刊
1671-654X
61-1276/TP
大16开
西安市太白北路156号
1971-01-01
中文
出版文献量(篇)
3986
总下载数(次)
0
总被引数(次)
18592
论文1v1指导