基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
简述了强化学习的基本原理和特点,讨论了强化学习中评价函数的神经网络近似问题,重点分析了采用多神经网络近似评价函数的学习问题,实现了状态空间或任务的自动分解,提高了评价函数的推广能力.网络的学习是离线进行,并作为反馈控制器在线应用.并以A~学习为例,将强化学习应用于导弹的制导问题,仿真结果表明了强化学习在导弹制导或控制问题中的应用前景和有效性.
推荐文章
分布式强化学习在RoboCup中的应用
强化学习
分布式强化学习
Agent
RoboCup
强化学习在足球机器人基本动作学习中的应用
强化学习
机器人足球比赛
行为学习
T-S模糊神经网络
H∞输出跟踪理论在导弹制导律设计中的应用
H∞输出跟踪
制导律
鲁棒性
分层强化学习在足球机器人中的应用
强化学习
Q_learning算法
MaxQ算法
Robocup
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 强化学习在导弹制导中的应用
来源期刊 控制理论与应用 学科 工学
关键词 神经网络 强化学习 微分对策 导弹制导
年,卷(期) 2001,(5) 所属期刊栏目 短文
研究方向 页码范围 748-750
页数 3页 分类号 TP1
字数 1998字 语种 中文
DOI 10.3969/j.issn.1000-8152.2001.05.023
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈宗基 北京航空航天大学自动控制系 99 1077 19.0 29.0
2 周锐 北京航空航天大学自动控制系 81 1192 19.0 31.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (10)
同被引文献  (32)
二级引证文献  (0)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2003(1)
  • 引证文献(1)
  • 二级引证文献(0)
2004(1)
  • 引证文献(1)
  • 二级引证文献(0)
2005(1)
  • 引证文献(1)
  • 二级引证文献(0)
2006(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(4)
  • 引证文献(4)
  • 二级引证文献(0)
研究主题发展历程
节点文献
神经网络
强化学习
微分对策
导弹制导
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
控制理论与应用
月刊
1000-8152
44-1240/TP
大16开
广州市五山华南理工大学内
46-11
1984
chi
出版文献量(篇)
4979
总下载数(次)
16
总被引数(次)
72515
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导