基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在大数据时代,海量的非结构化数据增速远大于结构化数据,HBase被广泛用于海量非结构化数据存储中.由于HBase内置的索引是基于行键(rowkey)设计的,具有很高的查询效率.但是,在根据字段进行条件查询时需要进行全表扫描,性能较低,无法应用于实时场景.针对此问题,提出一种基于协处理器(coprocessor)的HBase二级索引方法.该方法将经常需要查询的字段通过协处理器在HBase中建立映射到行键的索引,在查询时并行扫描索引数据获取行键,并利用行键快速查询记录.同时,在创建表时,通过对Region进行预分区.在插入数据时,在行键中添加Hash值.这不仅能提高数据插入速度,也避免了热点数据现象,同时保证索引数据和主数据位于同一个Region上,查询时就能减少一次RPC请求.在模拟数据集上的实验表明:提出的二级索引方法具有较好的查询性能.不仅高于HBase自带的过滤查询,也高于基于ElasticSearch的二级索引.同时,其空间开销小于基于ElasticSearch的二级索引.
推荐文章
面向大数据存储的HBase二级索引设计
计算机软件
HBase
二级索引
聚集
转义
基于协处理器的HBase内存索引机制的研究
HBase
内存索引
HT树
持久化
密码协处理器指令级并行编译研究
密码协处理器
超长指令字
可重构计算
指令级并行
指令调度
HBase分布式二级索引通用方案研究
分布式存储
分布式索引
二级索引
协处理器
通用方案
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于协处理器的HBase二级索引方法
来源期刊 计算机工程与应用 学科 工学
关键词 HBase 二级索引 协处理器 ElasticSearch
年,卷(期) 2019,(21) 所属期刊栏目 大数据与云计算
研究方向 页码范围 86-91
页数 6页 分类号 TP391
字数 3788字 语种 中文
DOI 10.3778/j.issn.1002-8331.1807-0289
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郭红 福州大学数学与计算机科学学院 44 244 8.0 14.0
4 郭昆 福州大学数学与计算机科学学院 37 180 8.0 11.0
11 周健倩 福州大学数学与计算机科学学院 1 3 1.0 1.0
20 张瑛瑛 3 5 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (91)
共引文献  (238)
参考文献  (13)
节点文献
引证文献  (3)
同被引文献  (12)
二级引证文献  (0)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(6)
  • 参考文献(0)
  • 二级参考文献(6)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(5)
  • 参考文献(1)
  • 二级参考文献(4)
2010(7)
  • 参考文献(0)
  • 二级参考文献(7)
2011(15)
  • 参考文献(0)
  • 二级参考文献(15)
2012(14)
  • 参考文献(1)
  • 二级参考文献(13)
2013(11)
  • 参考文献(1)
  • 二级参考文献(10)
2014(6)
  • 参考文献(2)
  • 二级参考文献(4)
2015(11)
  • 参考文献(2)
  • 二级参考文献(9)
2016(6)
  • 参考文献(2)
  • 二级参考文献(4)
2017(4)
  • 参考文献(3)
  • 二级参考文献(1)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
HBase
二级索引
协处理器
ElasticSearch
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导