基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在大数据背景下,数据库系统表连接操作的效率急需优化,尤其对于基线与增量数据分离的数据库系统来说,其连接操作更是成为其性能的主要瓶颈。为了有效提升事务处理的性能,在基线与增量数据分离的数据库系统架构中,通常将基线数据存储于磁盘中,增量数据存储于内存中,进而获得较高的事务处理吞吐量和可扩展性。 Hbase、BigTable、OceanBase 等系统是典型的基线与增量数据分离的数据库管理系统,但是他们的表连接效率较低,其主要原因包括:每次表连接前必须先合并基线数据和增量数据;数据存储模式更为复杂,导致过大的网络开销。该文提出了一种基线与增量数据分离架构下的排序归并连接优化算法。该算法对连接属性做范围切分,在多个节点上并行做排序归并连接。该算法无需在连接前合并基线数据和增量数据,进而实现对基线和增量数据并行处理,同时也避免了大量非连接结果集数据的基线与增量合并操作。并在开源的数据库 OceanBase 上实现了该算法,通过一系列实验证明,该算法可以极大提高 OceanBase 数据库的表连接处理性能。
推荐文章
可信分布式数据共享架构Dataweb研究
Dataweb
XDI
可扩展资源标识符
单点登录
支持海量数据的分布式数据库架构设计与验证
分布式数据库
数据库集群
数据库代理
分布式事务
基于连接依赖信息的分布式连接查询优化算法
分布式数据库
站点依赖
连接依赖
片段复制
分布式环境下散乱点云数据挖掘改进算法
分布式环境
云计算
散乱点云数据
数据挖掘
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基线与增量数据分离架构下的分布式连接算法
来源期刊 计算机学报 学科 工学
关键词 分布式连接 增量数据 并行处理 排序归并连接
年,卷(期) 2016,(10) 所属期刊栏目 数据科学与工程
研究方向 页码范围 2102-2113
页数 12页 分类号 TP311
字数 11294字 语种 中文
DOI 10.11897/SP.J.1016.2016.02102
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 周傲英 华东师范大学数据科学与工程研究院上海高可信计算重点实验室 68 2290 20.0 47.0
2 周敏奇 华东师范大学数据科学与工程研究院上海高可信计算重点实验室 20 280 7.0 16.0
3 樊秋实 华东师范大学数据科学与工程研究院上海高可信计算重点实验室 2 12 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (8)
同被引文献  (28)
二级引证文献  (5)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(4)
  • 引证文献(3)
  • 二级引证文献(1)
2019(5)
  • 引证文献(3)
  • 二级引证文献(2)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
分布式连接
增量数据
并行处理
排序归并连接
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
论文1v1指导