基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
大数据的存储与分析是近年来数据库领域研究的热点,高效的索引技术是提高大数据查询分析性能的重要技术手段。在现有的数据存储模型及索引技术研究基础上,提出使用MapReduce构建列存储数据的索引。该索引技术结合MapReduce编程模型,先在Map阶段完成数据划分,然后在Reduce阶段完成数据的排序,最后在数据有序的Reduce节点上创建RB+树索引,从而减少索引创建时因为RB+树内部节点递归分裂而产生的昂贵代价和树的高度,提高数据查询的性能。通过在真实数据集上进行实验,验证了所提出方法的有效性。
推荐文章
面向大数据存储的HBase二级索引设计
计算机软件
HBase
二级索引
聚集
转义
MapReduce框架下基于B+树的高维索引
大数据
MapReduce
KNN 查询
高维索引
云环境中基于相对索引散列树的数据审核方法
云环境
数据完整性审核
相对索引
散列树
计算成本
海量存储系统中的元数据分级索引算法
海量存储系统
元数据管理
元数据索引
分级索引
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 使用MapReduce构建列存储数据的索引
来源期刊 计算机应用与软件 学科 工学
关键词 列存储 MapReduce RB+索引
年,卷(期) 2014,(2) 所属期刊栏目 数据库技术
研究方向 页码范围 24-28
页数 5页 分类号 TP311.1
字数 5192字 语种 中文
DOI 10.3969/j.issn.1000-386x.2014.02.007
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 丁祥武 东华大学计算机科学与技术学院 27 181 8.0 11.0
2 乐嘉锦 东华大学计算机科学与技术学院 131 1480 20.0 32.0
3 李清炳 东华大学计算机科学与技术学院 1 11 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (12)
参考文献  (3)
节点文献
引证文献  (11)
同被引文献  (48)
二级引证文献  (23)
1952(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(8)
  • 引证文献(5)
  • 二级引证文献(3)
2016(5)
  • 引证文献(3)
  • 二级引证文献(2)
2017(7)
  • 引证文献(0)
  • 二级引证文献(7)
2018(9)
  • 引证文献(2)
  • 二级引证文献(7)
2019(3)
  • 引证文献(0)
  • 二级引证文献(3)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
列存储
MapReduce
RB+索引
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导