基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出一种基于模糊RBF网络的自适应模糊Actor-Critic学习.采用一个模糊RBF神经网络同时逼近Actor的动作函数和Critic的值函数,解决状态空间泛化中易出现的"维数灾"问题.模糊RBF网络能够根据环境状态和被控对象特性的变化进行网络结构和参数的自适应学习,使得网络结构更加紧凑,整个模糊Actor-Critic学习具有泛化性能好、控制结构简单和学习效率高的特点.Mountain Car的仿真结果验证了所提方法的有效性.
推荐文章
基于替代迹的蜂窝网信道分配Actor-Critic算法
信道分配
蜂窝网络
行动者—评论家
替代迹
一种自适应模糊Petri网及其应用
自适应
模糊
Petri网
人工神经网络
反向传播
学习
一种参数自适应模糊PID控制器
模糊
PID控制器
自适应
基于强化学习Actor-Critic算法的音乐生成
长短期记忆网络
音乐生成
深度学习
强化学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种自适应模糊Actor-Critic学习
来源期刊 控制与决策 学科 工学
关键词 Actor-Critic学习 模糊推理系统 RBF网络 泛化
年,卷(期) 2006,(9) 所属期刊栏目 短文
研究方向 页码范围 1068-1072
页数 5页 分类号 TP18
字数 4598字 语种 中文
DOI 10.3321/j.issn:1001-0920.2006.09.023
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 易建强 中国科学院自动化研究所 76 1420 21.0 33.0
2 程玉虎 中国矿业大学信息与电气工程学院 58 576 13.0 20.0
3 王雪松 中国矿业大学信息与电气工程学院 71 677 13.0 22.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (11)
共引文献  (7)
参考文献  (6)
节点文献
引证文献  (10)
同被引文献  (3)
二级引证文献  (14)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(3)
  • 参考文献(0)
  • 二级参考文献(3)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(3)
  • 参考文献(1)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(2)
  • 参考文献(2)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2008(1)
  • 引证文献(1)
  • 二级引证文献(0)
2010(4)
  • 引证文献(2)
  • 二级引证文献(2)
2011(1)
  • 引证文献(0)
  • 二级引证文献(1)
2012(3)
  • 引证文献(2)
  • 二级引证文献(1)
2013(3)
  • 引证文献(1)
  • 二级引证文献(2)
2014(4)
  • 引证文献(1)
  • 二级引证文献(3)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(3)
  • 引证文献(2)
  • 二级引证文献(1)
2018(3)
  • 引证文献(1)
  • 二级引证文献(2)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
Actor-Critic学习
模糊推理系统
RBF网络
泛化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
控制与决策
月刊
1001-0920
21-1124/TP
大16开
沈阳东北大学125信箱
1986
chi
出版文献量(篇)
7031
总下载数(次)
20
总被引数(次)
141238
论文1v1指导