基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
options是一种与SMDP模型紧密相关的引入时间抽象的强化学习算法,该算法一个重要且仍待解决的问题是如何能使agent自主找到合适的options.本文首先提出了一种基于访问落差变化率的子目标找寻算法,该算法克服了现有算法的低精确性和部分依赖人为因素的弊病.然后在该算法的基础上,提出了构造options的算法流程,并把这-算法运用于迷宫问题之中.实验结果表明利用实验生成的options可以大大加快学习的效率.
推荐文章
基于最小代价和生成树的算法研究
生成树
组合优化
多项式时间算法
基于改进遗传算法的试卷生成算法研究
题库
组卷
遗传算法
自适应交差概率
基于混沌和遗传算法的优化测试生成算法
神经网络
混沌搜索
遗传算法
测试生成
基于GIS的河道贴体网格自动生成算法研究
地理信息系统
数字高程模型
河道
贴体网格
自动生成
计算方法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于SMDP环境的自主生成options算法的研究
来源期刊 模式识别与人工智能 学科 工学
关键词 强化学习 马尔可夫决策过程 抉择 半马尔可夫决策过程 子目标
年,卷(期) 2005,(6) 所属期刊栏目 论文与报告
研究方向 页码范围 679-684
页数 6页 分类号 TP18
字数 4454字 语种 中文
DOI 10.3969/j.issn.1003-6059.2005.06.008
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈世福 南京大学计算机软件新技术国家重点实验室 169 4351 32.0 60.0
2 陈兆乾 南京大学计算机软件新技术国家重点实验室 74 1789 23.0 40.0
3 高阳 南京大学计算机软件新技术国家重点实验室 77 1645 20.0 39.0
4 苏畅 南京大学计算机软件新技术国家重点实验室 2 21 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (21)
同被引文献  (13)
二级引证文献  (144)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(1)
  • 引证文献(1)
  • 二级引证文献(0)
2007(2)
  • 引证文献(2)
  • 二级引证文献(0)
2008(3)
  • 引证文献(3)
  • 二级引证文献(0)
2009(2)
  • 引证文献(1)
  • 二级引证文献(1)
2010(5)
  • 引证文献(3)
  • 二级引证文献(2)
2011(8)
  • 引证文献(3)
  • 二级引证文献(5)
2012(7)
  • 引证文献(3)
  • 二级引证文献(4)
2013(15)
  • 引证文献(1)
  • 二级引证文献(14)
2014(12)
  • 引证文献(0)
  • 二级引证文献(12)
2015(10)
  • 引证文献(0)
  • 二级引证文献(10)
2016(12)
  • 引证文献(0)
  • 二级引证文献(12)
2017(26)
  • 引证文献(3)
  • 二级引证文献(23)
2018(27)
  • 引证文献(1)
  • 二级引证文献(26)
2019(23)
  • 引证文献(0)
  • 二级引证文献(23)
2020(12)
  • 引证文献(0)
  • 二级引证文献(12)
研究主题发展历程
节点文献
强化学习
马尔可夫决策过程
抉择
半马尔可夫决策过程
子目标
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
模式识别与人工智能
月刊
1003-6059
34-1089/TP
16开
中国科学院合肥智能机械研究所安徽合肥董铺岛合肥1130信箱
26-69
1989
chi
出版文献量(篇)
2928
总下载数(次)
8
总被引数(次)
30919
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导