基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
对广泛存在的一类事件驱动的平均费用型马尔可夫决策问题,通过分析其模型特征,研究了一种简单的增强型学习算法,不必将事件扩充为系统状态,而只对原始状态的值函数进行学习,减少了计算量和数据存储量。将算法应用于M/M/1排队系统的接纳控制问题,计算机仿真结果表明,算法优于通常的增强型学习和动态规划方法,验证了算法的有效性。
推荐文章
一类马氏过程随机泛函的指数矩
马氏过程
指数矩
最小非负解
一类有限非齐次马氏链的强大数定律
有限非齐次马氏链
熵密度
平均随机条件熵
强大数定律
一类新的q-Durrmeyer算子的逼近性质
新算子
逼近
收敛估计
关于可列非齐次马氏链泛函滑动平均的一类强极限定理
可列非齐次马氏链
泛函
B-C引理
强极限定理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一类事件驱动马氏决策过程的Q学习
来源期刊 系统工程与电子技术 学科 工学
关键词 马尔可夫过程学习算法动态规划模拟
年,卷(期) 2001,(4) 所属期刊栏目 软件与算法
研究方向 页码范围 80-82,封三
页数 4页 分类号 TP391.9
字数 语种 中文
DOI 10.3321/j.issn:1001-506X.2001.04.024
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郑应平 同济大学CIMS研究中心 74 440 12.0 15.0
2 王利存 中国科学院自动化研究所 6 41 4.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (4)
同被引文献  (2)
二级引证文献  (13)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2008(1)
  • 引证文献(1)
  • 二级引证文献(0)
2010(2)
  • 引证文献(1)
  • 二级引证文献(1)
2011(3)
  • 引证文献(1)
  • 二级引证文献(2)
2013(1)
  • 引证文献(0)
  • 二级引证文献(1)
2014(2)
  • 引证文献(0)
  • 二级引证文献(2)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(2)
  • 引证文献(0)
  • 二级引证文献(2)
2018(5)
  • 引证文献(1)
  • 二级引证文献(4)
研究主题发展历程
节点文献
马尔可夫过程学习算法动态规划模拟
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
系统工程与电子技术
月刊
1001-506X
11-2422/TN
16开
北京142信箱32分箱
82-269
1979
chi
出版文献量(篇)
10512
总下载数(次)
24
相关基金
国家重点基础研究发展计划(973计划)
英文译名:National Basic Research Program of China
官方网址:http://www.973.gov.cn/
项目类型:
学科类型:农业
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导