原文服务方: 弹箭与制导学报       
摘要:
自适应启发评价(AHC)增强学习结构分别逼近马尔可夫决策过程的值函数和策略函数,策略梯度增强学习能够将随机不确定的马尔可夫决策过程转换为确定性的马尔可夫决策过程.通过将AHC增强学习和策略梯度增强学习相结合,对PID控制器参数进行在线自适应整定,实现对无人直升机姿态控制性能的在线优化.仿真结果表明,与固定PID参数控制器相比,该算法能在线调整控制器参数,并很好地控制了无人直升机的悬停姿态.
推荐文章
无人直升机非线性鲁棒控制器设计及仿真
非线性鲁棒控制
直升机控制系统
鲁棒性
控制器
一种线性自抗扰控制器的无人直升机姿态控制方法研究
改进线性自抗扰控制器
无人直升机
姿态角控制
抗干扰
四旋翼无人直升机鲁棒飞行控制
四旋翼无人直升机
飞行控制
鲁棒补偿
基于替代传导径迹增强式学习的自主式微直升机控制
微电子机械系统
自主微直升机
增强式学习
替代传导径迹
即时差分
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于增强学习的无人直升机姿态控制器设计
来源期刊 弹箭与制导学报 学科
关键词 无人直升机 增强学习 自适应启发评价 策略梯度 PEGASUS
年,卷(期) 2008,(2) 所属期刊栏目 导弹与制导技术
研究方向 页码范围 73-76
页数 4页 分类号 V249.1|TP273
字数 语种 中文
DOI 10.3969/j.issn.1673-9728.2008.02.023
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 马宏绪 国防科学技术大学机电工程与自动化学院 21 626 8.0 21.0
2 黄茜薇 国防科学技术大学机电工程与自动化学院 6 11 2.0 3.0
3 税海涛 国防科学技术大学机电工程与自动化学院 4 23 3.0 4.0
4 蔡文澜 国防科学技术大学机电工程与自动化学院 2 9 2.0 2.0
8 王俊生 国防科学技术大学机电工程与自动化学院 3 13 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (2)
同被引文献  (2)
二级引证文献  (0)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
无人直升机
增强学习
自适应启发评价
策略梯度
PEGASUS
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
弹箭与制导学报
双月刊
1673-9728
61-1234/TJ
大16开
1980-01-01
chi
出版文献量(篇)
0
总下载数(次)
0
总被引数(次)
28550
论文1v1指导