基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着大数据应用的普及,高效可扩展的数据流操作在实时分析处理中扮演着越来越重要的角色.分布式并行处理架构是应对大流量、低延时数据流处理任务的一种有效解决方案.然而在Key-based分组并行处理中,由于数据的倾斜分布及数据流本身的实时、动态和数据规模不可预知等特性,使得数据流分布并行处理系统存在持续且动态负载不均衡现象,这会造成系统时效性降低、硬件资源浪费等问题.现有的研究工作处理均衡负载有两种方案:(1)基于key粒度的迁移,使得并行处理节点负载达到均衡;(2)基于元组粒度级别的拆分,采用随机分发使系统均衡.前者将系统调整至给定的均衡容忍范围内,类似于一维装箱的NP问题;后者对key的拆分势必带来新的为维护Key-based操作的正确性而增加的额外代价,如内存及网络通信成本.综合两种方法,提出对key按需拆分、尽量合并的方法,通过轻量级均衡调整算法以及保证Key-based操作特性的拆分方法,使系统既能达到后者的均衡,又能减少细粒度均衡所带来的额外代价.
推荐文章
分布式数据流上的连续异常检测
异常检测
核密度估计
分布数据流
数据流挖掘
分布式数据流中挖掘频繁项算法的研究
分布式数据流
频繁项
多线程并发技术
分布式数据流的渐增式聚集维护算法
数据流
分布式系统
增量聚集
基于分布式数据流的网络处理器数据收集分类平台
分布式数据流
网络处理器
数据收集
数据分类
分类平台
特征更新
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 分布式数据流上的高性能分发策略
来源期刊 软件学报 学科 工学
关键词 分布式数据流 负载倾斜 基于Key操作 均衡调整 负载迁移
年,卷(期) 2017,(3) 所属期刊栏目 大数据管理技术专刊
研究方向 页码范围 563-578
页数 16页 分类号 TP311
字数 13624字 语种 中文
DOI 10.13328/j.cnki.jos.005168
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (61)
共引文献  (378)
参考文献  (5)
节点文献
引证文献  (10)
同被引文献  (36)
二级引证文献  (5)
1959(1)
  • 参考文献(0)
  • 二级参考文献(1)
1969(1)
  • 参考文献(0)
  • 二级参考文献(1)
1970(2)
  • 参考文献(0)
  • 二级参考文献(2)
1984(2)
  • 参考文献(0)
  • 二级参考文献(2)
1985(3)
  • 参考文献(0)
  • 二级参考文献(3)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(5)
  • 参考文献(0)
  • 二级参考文献(5)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(3)
  • 参考文献(1)
  • 二级参考文献(2)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(5)
  • 参考文献(0)
  • 二级参考文献(5)
2010(6)
  • 参考文献(0)
  • 二级参考文献(6)
2011(11)
  • 参考文献(0)
  • 二级参考文献(11)
2012(4)
  • 参考文献(1)
  • 二级参考文献(3)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(4)
  • 引证文献(4)
  • 二级引证文献(0)
2019(5)
  • 引证文献(3)
  • 二级引证文献(2)
2020(4)
  • 引证文献(1)
  • 二级引证文献(3)
研究主题发展历程
节点文献
分布式数据流
负载倾斜
基于Key操作
均衡调整
负载迁移
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
论文1v1指导