原文服务方: 信息与控制       
摘要:
针对连续空间下的强化学习控制问题,提出了一种基于自组织模糊RBF网络的Q学习方法.网络的输入为状态,输出为连续动作及其Q值,从而实现了"连续状态一连续动作"的映射关系.首先将连续动作空间离散化为确定数目的离散动作,采用完全贪婪策略选取具有最大Q值的离散动作作为每条模糊规则的局部获胜动作.然后采用命令融合机制对获胜的离散动作按其效用值进行加权,得到实际作用于系统的连续动作.另外,为简化网络结构和提高学习速度,采用改进的RAN算法和梯度下降法分别对网络的结构和参数进行在线自适应调整.倒立摆平衡控制的仿真结果验证了所提Q学习方法的有效性.
推荐文章
基于Q学习的无线传感器网络自组织方法研究
无线传感器网络
自组织
Q学习
多Agent
生存期
基于自组织选取中心的广义RBF神经网络学习算法
RBF神经网络
自组织选取中心
基函数
一种自组织特征映射网络的模糊学习方法
自组织特征映射网络
学习方法
模糊熵准则
复合准则
基于EKF的模糊神经网络快速自组织学习算法
模糊神经网络
扩展卡尔曼滤波
自组织学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于自组织模糊RBF网络的连续空间Q学习
来源期刊 信息与控制 学科
关键词 自组织 模糊RBF网络 连续空间 Q学习 Q值
年,卷(期) 2008,(1) 所属期刊栏目 论文与报告
研究方向 页码范围 1-8
页数 8页 分类号 TPL8
字数 语种 中文
DOI 10.3969/j.issn.1002-0411.2008.01.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 易建强 中国科学院自动化研究所 76 1420 21.0 33.0
2 程玉虎 中国矿业大学信息与电气工程学院 58 576 13.0 20.0
3 王雪松 中国矿业大学信息与电气工程学院 71 677 13.0 22.0
4 孙伟 中国矿业大学信息与电气工程学院 105 523 13.0 17.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (57)
参考文献  (11)
节点文献
引证文献  (13)
同被引文献  (6)
二级引证文献  (28)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(2)
  • 参考文献(2)
  • 二级参考文献(0)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(2)
  • 二级参考文献(0)
1998(2)
  • 参考文献(1)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2009(3)
  • 引证文献(3)
  • 二级引证文献(0)
2010(10)
  • 引证文献(2)
  • 二级引证文献(8)
2011(1)
  • 引证文献(0)
  • 二级引证文献(1)
2012(7)
  • 引证文献(3)
  • 二级引证文献(4)
2013(6)
  • 引证文献(0)
  • 二级引证文献(6)
2014(3)
  • 引证文献(2)
  • 二级引证文献(1)
2015(4)
  • 引证文献(1)
  • 二级引证文献(3)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(4)
  • 引证文献(1)
  • 二级引证文献(3)
2019(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
自组织
模糊RBF网络
连续空间
Q学习
Q值
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息与控制
双月刊
1002-0411
21-1138/TP
大16开
1972-01-01
chi
出版文献量(篇)
2891
总下载数(次)
0
总被引数(次)
41289
相关基金
中国博士后科学基金
英文译名:China Postdoctoral Science Foundation
官方网址:http://www.chinapostdoctor.org.cn/index.asp
项目类型:
学科类型:
论文1v1指导