基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
图数据划分是基于BSP(bulk synchronous parallel)编程模型的大规模图处理系统中一个关键技术问题。传统的图划分技术需要多次迭代,时间复杂度过高,且划分结果不具有图顶点到分区的映射信息,因此这些算法并不适用于BSP模型下的数据划分。提出了一种新的面向BSP模型的负载均衡Hash数据划分算法(balanced Hash partition,BHP)。为了实现各个分区的出边数尽可能均衡,该算法引入了虚拟桶的概念,通过贪婪算法将虚拟桶重组为实际分区,保证了每个实际分区负载均衡,同时数据本地化策略使本分片上的数据尽可能地保留在本节点上,从而减小在数据加载时的数据迁移开销。从三个方面对比了BHP算法和经典Hash算法的性能,结果表明BHP算法能够提高作业的执行效率,减少消息发送的数量,有效解决了经典Hash算法的负载不均衡和分区间交互边过多的问题,当数据量变大时,效果尤为明显。
推荐文章
面向多进程负载均衡的Hash算法比较与分析
多进程
负载均衡
Hash算法
分配均衡
时延
高性能
面向WSN数据汇集应用的动态负载均衡算法
无线传感器网络
数据汇集应用
负载均衡
面向数据中心网络的分布式负载均衡网关架构
数据中心网络
负载均衡
高并发
低延时
现场可编程门阵列
并行随机抽样贪心算法分区的MapReduce负载均衡研究
MapReduce
负载均衡
贪心算法分区
并行随机抽样
分区建模
对比验证
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 BHP:面向BSP模型的负载均衡Hash图数据划分
来源期刊 计算机科学与探索 学科 工学
关键词 BSP模型 图划分 分布式系统 负载均衡 虚拟桶
年,卷(期) 2014,(1) 所属期刊栏目 数据库技术
研究方向 页码范围 40-50
页数 11页 分类号 TP311
字数 9279字 语种 中文
DOI 10.3778/j.issn.1673-9418.1305052
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 于戈 东北大学信息科学与工程学院 426 6587 38.0 64.0
2 鲍玉斌 东北大学信息科学与工程学院 85 1496 22.0 36.0
3 冷芳玲 东北大学信息科学与工程学院 16 146 7.0 12.0
4 王志刚 东北大学信息科学与工程学院 5 49 3.0 5.0
5 邓超 中国移动通信研究院业务支撑研究所 5 39 3.0 5.0
6 周爽 东北大学信息科学与工程学院 3 14 1.0 3.0
7 郭磊涛 中国移动通信研究院业务支撑研究所 1 14 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (14)
同被引文献  (5)
二级引证文献  (25)
1990(2)
  • 参考文献(2)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(5)
  • 引证文献(3)
  • 二级引证文献(2)
2016(9)
  • 引证文献(4)
  • 二级引证文献(5)
2017(10)
  • 引证文献(3)
  • 二级引证文献(7)
2018(9)
  • 引证文献(2)
  • 二级引证文献(7)
2019(4)
  • 引证文献(1)
  • 二级引证文献(3)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
BSP模型
图划分
分布式系统
负载均衡
虚拟桶
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学与探索
月刊
1673-9418
11-5602/TP
大16开
北京市海淀区北四环中路211号北京619信箱26分箱
82-560
2007
chi
出版文献量(篇)
2215
总下载数(次)
4
总被引数(次)
10748
论文1v1指导