原文服务方: 计算机应用研究       
摘要:
针对航迹探测领域中探测器获得的目标地理位置通常是同一帧下无法区分的多目标场景,需要利用目标位置信息还原各航迹并区分各目标的问题进行研究,提出采用深度强化学习复原目标航迹的方法.依据目标航迹的物理特点,提取数学模型,结合目标航迹的方向、曲率等提出轨迹曲率圆(TOC)奖励函数,使深度强化学习能够有效复原多目标航迹并区分各目标.首先描述多目标航迹复原问题,并将问题建模成深度强化学习能够处理的模型;结合TOC奖励函数对多目标航迹复原问题进行实验;最后给出该奖励函数的数学推导和物理解释.实验结果表明,TOC奖励函数驱动下的深度强化网络能够有效还原目标的航迹,在航向和航速方面切合实际目标航迹.
推荐文章
基于深度强化学习的车辆多目标协同巡航决策控制系统设计
深度强化学习
车辆多目标
协同巡航
决策控制
轨迹跟踪器
多目标解耦
协同参数
量化分析
面向轨迹规划的深度强化学习奖励函数设计
深度强化学习
机械臂
轨迹规划
方位奖励函数
基于多目标提取与航迹处理的目标告警算法
岸基光电设备
目标告警
目标提取
航迹处理
飞行器航迹规划的多目标优化方法
航迹规划
航迹代价
性能指标
多目标优化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 深度强化学习复原多目标航迹的TOC奖励函数
来源期刊 计算机应用研究 学科
关键词 深度强化学习 序贯决策 Q函数 轨迹密切圆
年,卷(期) 2020,(6) 所属期刊栏目 算法研究探讨
研究方向 页码范围 1626-1632
页数 7页 分类号 TP391
字数 语种 中文
DOI 10.19734/j.issn.1001-3695.2018.12.0886
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 沈超 西安交通大学智能网络与网络安全教育部重点实验室 10 45 4.0 6.0
2 贺亮 10 21 3.0 4.0
3 李赟 7 11 2.0 3.0
4 徐正国 9 17 3.0 4.0
5 贾愚 2 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (47)
共引文献  (16)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(5)
  • 参考文献(0)
  • 二级参考文献(5)
2014(5)
  • 参考文献(0)
  • 二级参考文献(5)
2015(7)
  • 参考文献(3)
  • 二级参考文献(4)
2016(3)
  • 参考文献(1)
  • 二级参考文献(2)
2017(6)
  • 参考文献(0)
  • 二级参考文献(6)
2018(7)
  • 参考文献(0)
  • 二级参考文献(7)
2019(1)
  • 参考文献(0)
  • 二级参考文献(1)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
深度强化学习
序贯决策
Q函数
轨迹密切圆
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
论文1v1指导