作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
强化学习具有与环境交互的优势,笔者提出的基于知识的Q-学习算法(KBQL)就是利用Q-学习算法的这个特点,利用Agent的先验知识来缩小Agent学习的状态空间,以加速强化学习的收敛性,同时采用Agent的学习机制克服其知识的不精确性,从而提高学习算法的鲁棒性和适应性.
推荐文章
基于信度分配函数的Agent强化学习算法
强化学习
Q-学习
信度分配强化学习
基于个性的群体强化学习算法
个性
Agent
群体强化学习
RoboCup
利用聚类分析法改进的多Agent协作强化学习方法
多agent协作
强化学习
聚类分析
Friend-or-Foe
Q-学习
基于强化学习的多移动Agent学习算法
强化学习
移动Agent
学习
学习算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于知识的Agent强化学习算法分析与研究
来源期刊 电子设计工程 学科 工学
关键词 强化学习 KBQL Agent 鲁棒性 适应性
年,卷(期) 2011,(11) 所属期刊栏目 计算机技术与应用
研究方向 页码范围 115-117
页数 分类号 TP3-01
字数 3874字 语种 中文
DOI 10.3969/j.issn.1674-6236.2011.11.036
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 殷锋社 45 155 6.0 10.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (21)
共引文献  (52)
参考文献  (9)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1990(5)
  • 参考文献(0)
  • 二级参考文献(5)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(6)
  • 参考文献(2)
  • 二级参考文献(4)
2000(3)
  • 参考文献(2)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(3)
  • 参考文献(1)
  • 二级参考文献(2)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
强化学习
KBQL
Agent
鲁棒性
适应性
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子设计工程
半月刊
1674-6236
61-1477/TN
大16开
西安市高新区高新路25号瑞欣大厦10A室
52-142
1994
chi
出版文献量(篇)
14564
总下载数(次)
54
总被引数(次)
54366
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导