原文服务方: 信息与控制       
摘要:
在强化学习的研究中,常用的知识传递方法通过抽取系统最优策略的特征获得知识.由于所获得知识通常与系统参数有关,因此这些方法难以应用于状态转移概率随系统参数变化的一类任务中.本文提出一种基于定件模糊网络的分层Option算法,该算法用定性动作描述系统的次优策略,并用定性模糊网络抽取次优策略的共同特征获得与参数无关的知识,完成知识传递.倒立摆系统的摔制实验结果表明:定性模糊网络能有效地表示各种参数值不同的倒立摆系统所具有的控制规律,获取与系统参数无关的知识,将常用的知识传递方法从参数无关任务扩展到参数相关任务中.
推荐文章
基于遗传算法和模糊神经网络的边坡稳定性评价
遗传算法
模糊神经网络
边坡稳定性
评价
基于云模型的模糊神经网络算法研究
模糊神经网络
数据挖掘
云模型
云规则生成
'软与'算法
BP算法优化
不确定性推理
基于分层结构保留的增量网络爬虫算法
网络爬虫
URL过滤器
层次结构保存
频率模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于定性模糊网络的分层Option算法
来源期刊 信息与控制 学科
关键词 强化学习 定性动作 倒立摆
年,卷(期) 2009,(6) 所属期刊栏目 论文与报告
研究方向 页码范围 673-679
页数 7页 分类号 TP18
字数 语种 中文
DOI 10.3969/j.issn.1002-0411.2009.06.006
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 罗四维 北京交通大学计算机与信息技术学院 99 1303 17.0 33.0
2 郑宇 北京交通大学计算机与信息技术学院 6 26 2.0 5.0
3 吕子昂 北京交通大学计算机与信息技术学院 5 10 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
强化学习
定性动作
倒立摆
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息与控制
双月刊
1002-0411
21-1138/TP
大16开
1972-01-01
chi
出版文献量(篇)
2891
总下载数(次)
0
总被引数(次)
41289
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
论文1v1指导