基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
索引是所有搜索引擎的核心概念,为了进行快速查找,就需要把数据处理成一种高效的、可交叉引用的组织格式.倒排索引是一种高效的索引组织模式,其组织模式和存储结构对检索系统的性能起着至关重要的作用,文中探讨了基于Lucene的倒排索引模式,分析了 Lucene 索引文件的结构、索引过程以及相关排序算法,讨论了Lucene 的压缩算法,并且通过设计一个中文模块实现了基于正向减字最大匹配分词方式的中文索引.实验表明新的分词算法比Lucene自带的分词算法性能有了很大的提高.
推荐文章
基于XML的搜索引擎倒排索引研究
XML
搜索引擎
倒排索引
基于综合倒排索引的个性化搜索引擎研究
信息检索
个性化搜索
用户兴趣模型
综合倒排索引
基于Lucene\XML技术的Web搜索引擎设计与实现
搜索引擎
Lucene
XML
索引
检索
Wap
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Lucene的中文倒排索引技术的研究
来源期刊 计算机技术与发展 学科 工学
关键词 全文检索 倒排索引 索引压缩 Lucene
年,卷(期) 2010,(3) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 80-83
页数 4页 分类号 TP391.3
字数 3336字 语种 中文
DOI 10.3969/j.issn.1673-629X.2010.03.021
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 林世平 福州大学数学与计算机科学学院 34 380 8.0 19.0
2 郑榕增 福州大学数学与计算机科学学院 1 137 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (18)
共引文献  (61)
参考文献  (5)
节点文献
引证文献  (137)
同被引文献  (146)
二级引证文献  (189)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(4)
  • 参考文献(0)
  • 二级参考文献(4)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(2)
  • 二级参考文献(1)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(15)
  • 引证文献(13)
  • 二级引证文献(2)
2012(16)
  • 引证文献(12)
  • 二级引证文献(4)
2013(32)
  • 引证文献(18)
  • 二级引证文献(14)
2014(27)
  • 引证文献(17)
  • 二级引证文献(10)
2015(42)
  • 引证文献(20)
  • 二级引证文献(22)
2016(49)
  • 引证文献(18)
  • 二级引证文献(31)
2017(50)
  • 引证文献(16)
  • 二级引证文献(34)
2018(58)
  • 引证文献(15)
  • 二级引证文献(43)
2019(32)
  • 引证文献(8)
  • 二级引证文献(24)
2020(5)
  • 引证文献(0)
  • 二级引证文献(5)
研究主题发展历程
节点文献
全文检索
倒排索引
索引压缩
Lucene
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导