基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对Hadoop框架下map任务阶段的任务完成时间和数据局部性问题,提出了一种基于拉格朗日插值多项式的数据复制和数据副本放置算法.具体实现是通过使用拉格朗日插值多项式来预测数据文件的访问计数,从而优化每个数据文件的复制因子,自适应地决定是否产生一个新的副本,或使用已加载的数据作为缓存;并提出了一种数据副本放置算法来有效地减轻rack和rack-off局部性.性能仿真结果表明,数据复制和数据放置算法相比于Hadoop中默认的数据复制设置,在map阶段的任务完成时间平均降低了约9.6%.在数据局部性方面,具有node局部性的map任务数量增加了6.1%,而具有rack和rack-off局部性的map任务数量则分别减少了45.6%和56.5%.
推荐文章
基于数据局部性的推测式Hadoop任务调度算法研究
Hadoop
任务调度
异构环境
数据局部性
基于文档副本局部性的分布式检索算法研究
信息检索
搜索引擎
副本
局部性
分布式检索
基于蚁群算法的数据副本放置策略
网格
蚁群算法
复制
放置策略
虚拟组织
基于数据局部性的推测式Hadoop任务调度算法研究
Hadoop
任务调度
异构环境
数据局部性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 减少任务完成时间和数据局部性的数据复制及副本放置算法
来源期刊 电子测量与仪器学报 学科 工学
关键词 Hadoop 数据局部性 任务完成时间 访问计数预测 数据复制 副本
年,卷(期) 2018,(2) 所属期刊栏目 学术论文
研究方向 页码范围 146-152
页数 7页 分类号 TP311
字数 语种 中文
DOI 10.13382/j.jemi.2018.02.021
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (29)
共引文献  (30)
参考文献  (7)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(5)
  • 参考文献(0)
  • 二级参考文献(5)
2011(7)
  • 参考文献(1)
  • 二级参考文献(6)
2012(6)
  • 参考文献(1)
  • 二级参考文献(5)
2013(4)
  • 参考文献(1)
  • 二级参考文献(3)
2014(4)
  • 参考文献(1)
  • 二级参考文献(3)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Hadoop
数据局部性
任务完成时间
访问计数预测
数据复制
副本
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子测量与仪器学报
月刊
1000-7105
11-2488/TN
大16开
北京市东城区北河沿大街79号
80-403
1987
chi
出版文献量(篇)
4663
总下载数(次)
23
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导