基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着大数据应用发展,如何从海量数据中进行高效信息搜索成为研究热点.Lucene全文搜索引擎通过索引段合并来提高索引效率,但Lucene索引段合并过程大多需要从磁盘加载各索引段,将占用大量系统资源,降低系统吞吐量.针对该问题,提出基于Lucene索引段合并优化策略,该策略通过负载系数来选择不同的索引段合并操作.为提高数据的检索速度,进一步建立索引段相似度评价模型来选择出最优合并索引段集合进行合并.通过与现有Tiere,LogByte,LogDoc等合并策略进行实验对比,提出的优化策略能有效减少索引段合并次数,提升系统吞吐量及索引效率.
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Lucene索引段合并优化策略
来源期刊 重庆邮电大学学报(自然科学版) 学科 工学
关键词 Lucene 索引段合并 负载系数 索引段相似度 最优合并索引段
年,卷(期) 2020,(1) 所属期刊栏目 计算机与自动化
研究方向 页码范围 105-112
页数 8页 分类号 TP391
字数 4921字 语种 中文
DOI 10.3979/j.issn.1673-825X.2020.01.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 熊安萍 重庆邮电大学计算机科学与技术学院 44 302 9.0 15.0
2 曹春江 3 1 1.0 1.0
3 李传根 重庆邮电大学计算机科学与技术学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (29)
共引文献  (8)
参考文献  (7)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(6)
  • 参考文献(0)
  • 二级参考文献(6)
2012(6)
  • 参考文献(0)
  • 二级参考文献(6)
2013(5)
  • 参考文献(1)
  • 二级参考文献(4)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(3)
  • 参考文献(2)
  • 二级参考文献(1)
2016(2)
  • 参考文献(1)
  • 二级参考文献(1)
2017(3)
  • 参考文献(3)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Lucene
索引段合并
负载系数
索引段相似度
最优合并索引段
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
重庆邮电大学学报(自然科学版)
双月刊
1673-825X
50-1181/N
大16开
重庆南岸区
78-77
1988
chi
出版文献量(篇)
3229
总下载数(次)
12
总被引数(次)
19476
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导