基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对Hadoop和Spark等大数据分析系统中无先验知识任务的高效执行问题,设计了基于累计工作量(CRW)的任务调度器CRWScheduler.该调度器根据CRW将任务在低权重队列与高权重队列间切换;在为作业分配资源时,同时考虑到作业所在的队列和其瞬时占用资源量,无需作业先验知识即显著提升系统性能.基于Apache Hadoop YARN实现了CRWScheduler原型,在28个节点的基准测试集群上的实验表明,与YARN的公平调度机制相比,作业流时间(JFT)平均降低21%,其中95百分位的作业流时间(JFT)最多降低了35%,并且在与任务级调度程序协作时可获得进一步的性能提升.
推荐文章
基于数据挖掘的混合云作业调度算法
云计算系统
作业调度
完成时间
数据挖掘
服务质量
大数据分析概要
大数据
大数据分析
未来趋势
基于大数据分析技术的旅游智慧平台设计
旅游智慧平台
平台设计
大数据分析
信息挖掘
路线推荐
对比实验
基于大数据分析技术的智慧教育平台设计
教育平台设计
智慧教育
课程管理
大数据分析
在线学习
教育资源存储
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于累计工作量的在线大数据分析作业调度算法
来源期刊 计算机应用 学科 工学
关键词 数据分析系统 作业流时间 公平性 饥饿避免
年,卷(期) 2019,(8) 所属期刊栏目 应用前沿、交叉与综合
研究方向 页码范围 2431-2437
页数 7页 分类号 TP316.4
字数 7633字 语种 中文
DOI 10.11772/j.issn.1001-9081.2019010073
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 钱柱中 南京大学计算机科学与技术系 19 312 8.0 17.0
2 邹云峰 国网江苏省电力有限公司电力科学研究院 17 19 3.0 4.0
3 徐超 国网江苏省电力有限公司电力科学研究院 27 33 3.0 4.0
4 许道强 6 6 1.0 2.0
5 李叶飞 南京大学计算机科学与技术系 3 2 1.0 1.0
6 张晓达 南京大学计算机科学与技术系 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (29)
参考文献  (5)
节点文献
引证文献  (1)
同被引文献  (5)
二级引证文献  (0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(5)
  • 参考文献(1)
  • 二级参考文献(4)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(3)
  • 参考文献(0)
  • 二级参考文献(3)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据分析系统
作业流时间
公平性
饥饿避免
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导