基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
可回收运载火箭的着陆制导需要严格保证着陆位置、速度精度,并尽量减小燃料消耗.基于最优控制的着陆制导方法需要依赖火箭精确模型,不具有对模型偏差的泛化能力.针对此问题,本文基于强化学习方法,通过不基于模型的交互采样,训练了神经网络形式的火箭着陆制导策略.首先,建立火箭着陆制导问题的马尔可夫决策过程模型,根据终端约束和燃料消耗指标设计了分阶段奖励函数;然后,在此基础上设计了多层感知机制导策略网络,并使用不基于模型的邻近策略优化算法,通过与火箭着陆制导马尔可夫决策过程的交互采样,实现对制导策略网络的迭代优化;最后,在可回收运载火箭着陆段仿真场景下对制导策略进行验证.仿真结果表明,本文提出的强化学习着陆制导策略能够保证火箭的着陆精度、燃料消耗与最优解相近,且能够泛化至火箭模型参数存在偏差的工况.
推荐文章
垂直着陆重复使用运载火箭对动力技术的挑战
运载火箭
液体火箭发动机
重复使用技术
推力调节
二次起动
垂直着陆重复使用运载火箭对动力技术的挑战
运载火箭
液体火箭发动机
重复使用技术
推力调节
二次起动
火箭垂直回收着陆段在线制导凸优化方法
火箭回收
垂直着陆
在线制导
凸优化
基于弹道制导联合仿真的新一代中型运载火箭安全余量分析
弹道仿真
安全余量
耗尽概率
运载能力
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于强化学习的可回收运载火箭着陆制导
来源期刊 空天防御 学科
关键词 着陆制导 可回收运载火箭 最优控制 强化学习 垂直回收
年,卷(期) 2021,(3) 所属期刊栏目 智能技术空天防御应用专栏|Intelligent Technology Applied in Air & Space Defense Column
研究方向 页码范围 33-40
页数 8页 分类号 V475.1
字数 语种 中文
DOI 10.3969/j.issn.2096-4641.2021.03.005
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (3)
参考文献  (7)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1964(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2017(3)
  • 参考文献(1)
  • 二级参考文献(2)
2018(3)
  • 参考文献(1)
  • 二级参考文献(2)
2019(2)
  • 参考文献(1)
  • 二级参考文献(1)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(2)
  • 参考文献(1)
  • 二级参考文献(1)
2021(2)
  • 参考文献(1)
  • 二级参考文献(1)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
着陆制导
可回收运载火箭
最优控制
强化学习
垂直回收
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
空天防御
季刊
2096-4641
31-3147/E
16开
上海市闵行区元江路3888号
2018
chi
出版文献量(篇)
213
总下载数(次)
1
总被引数(次)
107
论文1v1指导