基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
并行环境下的分布式连接处理要求制定划分策略以减少状态迁移和通信开销.相对于数据库管理系统而言,分布式数据流管理系统中的在线θ连接操作需要更高的计算成本和内存资源.基于完全二部图的连接模型可支持分布式数据流的连接操作.因为连接操作的每个关系仅存放于二部图模型的一侧处理单元,无需复制数据,且处理单元相互独立,因此该模型具有内存高效、易伸缩和可扩展等特性.然而,由于数据流速的不稳定性和属性值分布的不均衡性,导致倾斜数据流的连接操作易出现集群负载不均衡的现象.针对倾斜数据流的连接操作,模型无法动态分配查询节点,并需要人工干预数据分组的参数设置.尤其是应对全部历史数据的连接查询,模型效率更低.基于上述问题,提出了管理倾斜数据流连接的框架,使用基于键值和元组混合的划分样式,有效应对二部图模型的各侧倾斜数据.设计了重新动态分配查询节点的策略和状态迁移算法,以支持全历史数据的连接查询和自适应的资源管理.针对合成数据和真实数据的实验结果表明,该方案可有效应对倾斜数据的连接操作,并进一步提升分布式数据流管理系统的吞吐率,特别是降低云环境中的计算成本.
推荐文章
基于距离的数据流在线检测算法研究
数据流
滑动窗口
k-距离
异常检测
信息熵
基于经验模式分解的时间序列数据流在线预测
经验模式分解
最大Lyapunov指数
链式重写窗口
预测
SMJ:基于大纲的数据流多连接操作
自组织网络
大纲
数据流
多连接
多数据流连接算法
MapReduce平台上面向倾斜数据连接的负载平衡方法
倾斜数据
负载平衡
MapReduce平台
任务分配
特征提取
负载偏移控制
评价函数
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 应对倾斜数据流在线连接方法
来源期刊 软件学报 学科 工学
关键词 分布式数据流管理系统 在线连接 数据倾斜 状态迁移 二部图连接模型
年,卷(期) 2018,(3) 所属期刊栏目 基于图结构的大数据分析与管理技术专刊
研究方向 页码范围 869-882
页数 14页 分类号 TP311
字数 7177字 语种 中文
DOI 10.13328/j.cnki.jos.005440
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 孟小峰 中国人民大学信息学院 135 6213 41.0 77.0
2 王春凯 中国人民大学信息学院 3 37 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (56)
共引文献  (235)
参考文献  (3)
节点文献
引证文献  (2)
同被引文献  (5)
二级引证文献  (1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(11)
  • 参考文献(0)
  • 二级参考文献(11)
2013(22)
  • 参考文献(0)
  • 二级参考文献(22)
2014(5)
  • 参考文献(1)
  • 二级参考文献(4)
2015(4)
  • 参考文献(1)
  • 二级参考文献(3)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
分布式数据流管理系统
在线连接
数据倾斜
状态迁移
二部图连接模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导