基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
运用强化学习的方法来对连续的倒立摆系统实现平衡控制是一直以来有待解决的问题.该文将Q学习与神经网络中的BP网络、S激活函数相结合,利用神经网络的泛化性能,设计出一种新的学习控制策略,通过迭代和学习过程,不但能够解决倒立摆系统连续状态空间的输入问题,还成功解决了输出连续动作空间的问题.将此方法运用于连续倒立摆系统的平衡控制中,经过基于实际控制模型的Matlab软件仿真实验,结果显示了这个方法的可行性.该方法进一步提高了强化学习理论在实际控制系统中的应用价值.
推荐文章
基于粒子滤波神经网络的倒立摆控制系统
倒立摆
粒子滤波
神经网络
一种生长型神经网络的倒立摆控制方案
细胞生长结构
Hebb学习
倒立摆
模糊神经网络控制倒立摆系统
倒立摆
模糊控制
神经网络
BP算法
非线性倒立摆系统的神经网络辨识
倒立摆
非线性系统模型
神经网络辨识
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于神经网络的强化学习算法实现倒立摆控制
来源期刊 计算机仿真 学科 工学
关键词 强化学习 神经网络 激活函数 泛化性能 连续动作空间
年,卷(期) 2006,(4) 所属期刊栏目 仿真应用研究
研究方向 页码范围 298-300,325
页数 4页 分类号 TP273.2
字数 2582字 语种 中文
DOI 10.3969/j.issn.1006-9348.2006.04.079
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张涛 中国科学技术大学自动化系 473 4174 31.0 44.0
2 吴汉生 中国科学技术大学自动化系 5 46 3.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (45)
参考文献  (4)
节点文献
引证文献  (15)
同被引文献  (18)
二级引证文献  (21)
1983(2)
  • 参考文献(1)
  • 二级参考文献(1)
1989(2)
  • 参考文献(1)
  • 二级参考文献(1)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2007(1)
  • 引证文献(1)
  • 二级引证文献(0)
2008(3)
  • 引证文献(3)
  • 二级引证文献(0)
2009(3)
  • 引证文献(2)
  • 二级引证文献(1)
2010(3)
  • 引证文献(3)
  • 二级引证文献(0)
2011(2)
  • 引证文献(2)
  • 二级引证文献(0)
2012(2)
  • 引证文献(1)
  • 二级引证文献(1)
2013(1)
  • 引证文献(0)
  • 二级引证文献(1)
2014(4)
  • 引证文献(0)
  • 二级引证文献(4)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(3)
  • 引证文献(0)
  • 二级引证文献(3)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
2018(5)
  • 引证文献(2)
  • 二级引证文献(3)
2019(6)
  • 引证文献(1)
  • 二级引证文献(5)
研究主题发展历程
节点文献
强化学习
神经网络
激活函数
泛化性能
连续动作空间
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机仿真
月刊
1006-9348
11-3724/TP
大16开
北京海淀阜成路14号
82-773
1984
chi
出版文献量(篇)
20896
总下载数(次)
43
总被引数(次)
127174
论文1v1指导