原文服务方: 现代电子技术       
摘要:
针对传统MapReduce环境下Hash分区处理偏差数据时存在效率低下负载不均衡问题,采用两阶段分区,即基于并行相似随机抽样贪心算法分区.该抽样是基于Hadoop随机抽样在给定样本比率或特定置信度下的误差范围内快速且低错误率的预测key分布结果.优点在于利用MapReduce框架的并行性减少抽样开销成本,并采用一种评估模型来确定合适的抽样率,达到减少抽样开销成本和提高抽样准确性的目的.结合贪心算法分区代替Hadoop平台默认的Hash分区算法来划分中间数据,实现MapReduce负载均衡.Matlab实验仿真结果表明,并行随机抽样贪心算法分区无论从负载均衡还是执行时间上都优于原生Hadoop中Hash分区算法.
推荐文章
Hadoop平台中一种Reduce负载均衡贪心算法
MapReduce
贪心算法
Reduce负载均衡
抽样
Hadoop平台中一种Reduce负载均衡贪心算法
MapReduce
贪心算法
Reduce负载均衡
抽样
基于贪心算法的气象修正表自动分区拟合算法设计
气象修正表
自动分区
贪心算法
残差可控
基于负载均衡的MapReduce后备任务上限自适应算法
MapReduce
后备任务上限
自适应算法
负载水平
空闲节点强度
网络带宽
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 并行随机抽样贪心算法分区的MapReduce负载均衡研究
来源期刊 现代电子技术 学科
关键词 MapReduce 负载均衡 贪心算法分区 并行随机抽样 分区建模 对比验证
年,卷(期) 2020,(16) 所属期刊栏目 前沿交叉科学
研究方向 页码范围 170-173
页数 4页 分类号 TN919-34|TP311
字数 语种 中文
DOI 10.16652/j.issn.1004-373x.2020.16.045
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄伟建 河北工程大学信息与电气工程学院 43 119 6.0 9.0
2 黄亮 10 11 2.0 3.0
3 贾孟玉 河北工程大学信息与电气工程学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (43)
共引文献  (26)
参考文献  (11)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(8)
  • 参考文献(0)
  • 二级参考文献(8)
2014(5)
  • 参考文献(2)
  • 二级参考文献(3)
2015(8)
  • 参考文献(0)
  • 二级参考文献(8)
2016(11)
  • 参考文献(1)
  • 二级参考文献(10)
2017(4)
  • 参考文献(3)
  • 二级参考文献(1)
2018(5)
  • 参考文献(4)
  • 二级参考文献(1)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
MapReduce
负载均衡
贪心算法分区
并行随机抽样
分区建模
对比验证
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
现代电子技术
半月刊
1004-373X
61-1224/TN
大16开
1977-01-01
chi
出版文献量(篇)
23937
总下载数(次)
0
总被引数(次)
135074
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导