原文服务方: 计算机应用研究       
摘要:
MapReduce是目前广泛应用的并行计算框架,是Hadoop平台的重要组成部分.主要包括Map和Reduce函数,Map函数输出key-value键值对作为Reduce的输入.由于输入的动态性,不同主机上的Reduce处理的输入量存在不均衡性.如何解决Reduce的负载均衡是优化MapReduce的一个重要研究方向.对整体数据进行抽样,通过适量的样本分析数据,达到较小的代价获得可靠的key分布,提出贪心算法代替Hadoop平台默认的Hash算法来划分数据,实现Reduce负载均衡.提出的贪心算法主要思想是根据抽样数据,求取所有key频次的和对于Reduce节点数量的平均值,然后依次为每一个Reduce分配一个接近平均值的负载,从而达到整体的负载均衡.模拟实验表明,所提算法与默认的hash分区算法相比,运行时间节约10.6%,达到更好的负载均衡.
推荐文章
并行随机抽样贪心算法分区的MapReduce负载均衡研究
MapReduce
负载均衡
贪心算法分区
并行随机抽样
分区建模
对比验证
并行随机抽样贪心算法分区的MapReduce负载均衡研究
MapReduce
负载均衡
贪心算法分区
并行随机抽样
分区建模
对比验证
网格计算中一种负载均衡聚类匹配迁移算法
网格计算
负载均衡
聚类分析
匹配
负载预测
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Hadoop平台中一种Reduce负载均衡贪心算法
来源期刊 计算机应用研究 学科
关键词 MapReduce 贪心算法 Reduce负载均衡 抽样
年,卷(期) 2016,(9) 所属期刊栏目 算法研究探讨
研究方向 页码范围 2656-2659
页数 4页 分类号 TP301.6
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2016.09.021
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈志刚 中南大学软件学院 517 4717 33.0 48.0
2 曾锋 中南大学软件学院 37 244 9.0 13.0
3 刘朵 中南大学软件学院 1 20 1.0 1.0
4 姚亦韬 中南大学软件学院 1 20 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (18)
参考文献  (5)
节点文献
引证文献  (20)
同被引文献  (36)
二级引证文献  (46)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(3)
  • 参考文献(2)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(5)
  • 引证文献(3)
  • 二级引证文献(2)
2018(23)
  • 引证文献(10)
  • 二级引证文献(13)
2019(25)
  • 引证文献(3)
  • 二级引证文献(22)
2020(12)
  • 引证文献(3)
  • 二级引证文献(9)
研究主题发展历程
节点文献
MapReduce
贪心算法
Reduce负载均衡
抽样
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导