基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文提出一种基于定性模糊网络的强化学习知识传递方法.该方法通过建立系统的定性模型,并用定性模糊网络抽取基于定性动作的次优策略的共同特征获得与系统参数无关知识.这些知识能有效描述参数值不同的系统所具有的共同控制规律,加快在新参数值的系统中强化学习的收敛速度.
推荐文章
多智能体学习中基于知识的强化函数设计方法
智能体 强化学习 强化函数 Robot Soccer
基于先验知识的改进强化学习及其在MAS中应用
多智能体系统
先验知识
内在激励
强化学习
AODE中基于强化学习的Agent协商模型
多Agent系统
协商
强化学习
基于模型的层次化强化学习算法
强化学习
马尔科夫决策过程
探索策略
倒立摆
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 强化学习中基于定性模型的知识传递方法
来源期刊 计算机工程与科学 学科 工学
关键词 强化学习 定性模型 知识传递
年,卷(期) 2011,(6) 所属期刊栏目 人工智能
研究方向 页码范围 118-124
页数 分类号 TP18
字数 7176字 语种 中文
DOI 10.3969/j.issn.1007-130X.2011.06.023
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄晗文 湖南大学计算机与通信学院 26 74 4.0 8.0
5 郑宇 北京交通大学计算机与信息技术学院 6 26 2.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (5)
节点文献
引证文献  (2)
同被引文献  (16)
二级引证文献  (28)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(2)
  • 引证文献(1)
  • 二级引证文献(1)
2016(6)
  • 引证文献(0)
  • 二级引证文献(6)
2017(7)
  • 引证文献(0)
  • 二级引证文献(7)
2018(7)
  • 引证文献(0)
  • 二级引证文献(7)
2019(7)
  • 引证文献(0)
  • 二级引证文献(7)
研究主题发展历程
节点文献
强化学习
定性模型
知识传递
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导