基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于深度强化学习的连续状态空间无人机隐蔽接敌问题,提出了基于马尔可夫决策过程的隐蔽接敌双深度Q网络(DDQN)方法.利用DDQN生成目标值函数的方法解决了传统DQN的过拟合问题;采用按优先级随机抽样的方法获取训练样本,加速了神经网络的训练速度;设定贪婪系数按照指数下降的方法,解决了传统强化学习的"探索利用窘境";在势函数奖赏函数设计中引入角度因子,使其更加符合实际作战情况.仿真实验结果表明,DDQN具有较好的收敛性,能有效生成隐蔽接敌策略.
推荐文章
持续监视问题多无人机协同搜索策略
持续监视问题
多无人机
协同搜索
模糊聚类
民用无人机交通管理策略综述
无人机交通管理
策略
法规
解决方案
无人机编队协同探测研究
多智能体
协同探测
任务规划
多传感器信息融合
无人机编队
基于自主切换的无人机航向跟踪设计
无人机
编队协同
自主导航
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Double Deep Q Network的无人机隐蔽接敌策略
来源期刊 电光与控制 学科 航空航天
关键词 隐蔽接敌策略 空战决策 马尔可夫决策过程 双神经网络结构 DDQN算法
年,卷(期) 2020,(7) 所属期刊栏目 学术研究
研究方向 页码范围 52-57
页数 6页 分类号 V2
字数 5615字 语种 中文
DOI 10.3969/j.issn.1671-637X.2020.07.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 丁勇 南京航空航天大学自动化学院 38 271 8.0 15.0
2 何金 南京航空航天大学自动化学院 3 0 0.0 0.0
3 高振龙 南京航空航天大学自动化学院 3 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (89)
共引文献  (28)
参考文献  (11)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1957(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(3)
  • 参考文献(0)
  • 二级参考文献(3)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(7)
  • 参考文献(0)
  • 二级参考文献(7)
2007(5)
  • 参考文献(0)
  • 二级参考文献(5)
2008(10)
  • 参考文献(0)
  • 二级参考文献(10)
2009(16)
  • 参考文献(0)
  • 二级参考文献(16)
2010(5)
  • 参考文献(0)
  • 二级参考文献(5)
2011(7)
  • 参考文献(1)
  • 二级参考文献(6)
2012(6)
  • 参考文献(1)
  • 二级参考文献(5)
2013(5)
  • 参考文献(1)
  • 二级参考文献(4)
2014(3)
  • 参考文献(0)
  • 二级参考文献(3)
2015(8)
  • 参考文献(1)
  • 二级参考文献(7)
2016(3)
  • 参考文献(1)
  • 二级参考文献(2)
2017(4)
  • 参考文献(2)
  • 二级参考文献(2)
2018(4)
  • 参考文献(3)
  • 二级参考文献(1)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
隐蔽接敌策略
空战决策
马尔可夫决策过程
双神经网络结构
DDQN算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电光与控制
月刊
1671-637X
41-1227/TN
大16开
河南省洛阳市017信箱16分箱
1970
chi
出版文献量(篇)
4517
总下载数(次)
11
论文1v1指导