基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
尝试运用增强学习方法来研究平行机调度问题,通过定义系统状态、行为和报酬函数,把调度问题转化为平均报酬型半马尔可夫决策过程,并使用结合函数泛化器的R-Learning算法来解决.提出排名算法,并利用它和两种常用的调度规则(最短期望加工时间规则和先进先出规则)来定义增强学习的行为.实验结果表明,R-Learning算法通过仿真实验学习较优的调度策略,在不同的决策状态下选择最优或次优的行为,对每个测试问题的效果都优于以上任何一条调度规则.
推荐文章
基于二元增强学习架构的可重构制造系统调度
调度
增强学习
状态
行为
报酬
基于增强学习的网格化出租车调度方法
城市交通
出租车调度
增强学习
网格化管理
自适应式控制
基于深度增强学习的数据中心网络Coflow调度机制
数据中心网络
语义相关流
流调度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于增强学习的平行机调度研究
来源期刊 计算机集成制造系统 学科 数学
关键词 调度 平行机 增强学习 马尔可夫决策过程
年,卷(期) 2007,(1) 所属期刊栏目 论文
研究方向 页码范围 110-116
页数 7页 分类号 O223
字数 6847字 语种 中文
DOI 10.3969/j.issn.1006-5911.2007.01.018
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郑力 清华大学工业工程系 141 2494 26.0 45.0
2 张智聪 清华大学工业工程系 5 48 4.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (6)
参考文献  (10)
节点文献
引证文献  (4)
同被引文献  (6)
二级引证文献  (1)
1978(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(2)
  • 参考文献(1)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(1)
  • 二级参考文献(1)
2000(2)
  • 参考文献(2)
  • 二级参考文献(0)
2001(2)
  • 参考文献(2)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(2)
  • 参考文献(2)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2008(1)
  • 引证文献(1)
  • 二级引证文献(0)
2011(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
调度
平行机
增强学习
马尔可夫决策过程
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机集成制造系统
月刊
1006-5911
11-5946/TP
大16开
北京2413信箱34分箱
82-289
1995
chi
出版文献量(篇)
6201
总下载数(次)
22
总被引数(次)
127830
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导