基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为解决搜索引擎ASPSeek在大规模数据下检索效率低下、占用空间大以及不利于更新等问题,提出了一种分块式存储的倒排索引组织技术,并对基于外存的B+树索引和线性散列索引的性能进行了比较测试研究。测试结果表明,查询每万条数据耗时线性散列为B+树索引快57.40%,插入每万条数据耗时线性散列为B+树索引的2.44倍,删除每万条数据耗时线性散列为B+树索引的83.52%,线性散列索引文件大小为B+树索引文件大小的109.56%。由测试结果可知,B+树索引具有较快的索引构建和更新速度,而线性散列索引则具有较高的磁盘空间占用率和较好的查询性能。
推荐文章
大规模数据集的分布式索引机制研究
大规模数据集
分布式系统
索引结构
B+树
聚簇索引
非结构化海量网络数据处理技术研究
IENA
XNET/INET
PCAP
飞行试验
基于公共模型技术的非结构化元数据管理技术研究与应用
公共模型技术
非结构化
元数据
管理
非结构化数据的ETL设计
非结构化数据
结构化数据
CWM
ETL
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 大规模非结构化数据的索引技术研究
来源期刊 计算机技术与发展 学科 工学
关键词 大规模数据 倒排索引 分块式存储 线性散列 B+树
年,卷(期) 2014,(12) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 109-113
页数 5页 分类号 TP31
字数 5353字 语种 中文
DOI 10.3969/j.issn.1673-629X.2014.12
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张太红 新疆农业大学计算机与信息工程学院 74 332 9.0 15.0
3 郭斌 新疆农业大学计算机与信息工程学院 23 150 6.0 12.0
4 陈燕红 新疆农业大学计算机与信息工程学院 37 90 5.0 7.0
7 时亚南 新疆农业大学计算机与信息工程学院 2 5 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (89)
共引文献  (89)
参考文献  (14)
节点文献
引证文献  (2)
同被引文献  (1)
二级引证文献  (1)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(3)
  • 参考文献(0)
  • 二级参考文献(3)
1976(3)
  • 参考文献(0)
  • 二级参考文献(3)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1984(3)
  • 参考文献(0)
  • 二级参考文献(3)
1985(2)
  • 参考文献(0)
  • 二级参考文献(2)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(4)
  • 参考文献(0)
  • 二级参考文献(4)
1994(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(3)
  • 参考文献(0)
  • 二级参考文献(3)
1996(6)
  • 参考文献(0)
  • 二级参考文献(6)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(4)
  • 参考文献(0)
  • 二级参考文献(4)
2001(6)
  • 参考文献(0)
  • 二级参考文献(6)
2002(5)
  • 参考文献(1)
  • 二级参考文献(4)
2003(6)
  • 参考文献(0)
  • 二级参考文献(6)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(10)
  • 参考文献(1)
  • 二级参考文献(9)
2006(8)
  • 参考文献(2)
  • 二级参考文献(6)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(8)
  • 参考文献(1)
  • 二级参考文献(7)
2009(4)
  • 参考文献(1)
  • 二级参考文献(3)
2010(5)
  • 参考文献(4)
  • 二级参考文献(1)
2012(3)
  • 参考文献(2)
  • 二级参考文献(1)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
大规模数据
倒排索引
分块式存储
线性散列
B+树
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导