作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
介绍了开源搜索引擎Lucene的索引与搜索过程,剖析了Lucene的基于向量空间模型的文档相关度模型和基于TF-IDF的权重计分算法,在分析其文档相关度分值计算公式的基础上,指出了可通过修正评分机制和优化向量空间模型的算法来改进Lucene的搜索功能和性能的途径.并提出了一种基于离散随机最优化的快速搜索算法,以期提升Lucene在大文档集实时搜索时的性能.
推荐文章
基于人群搜索算法的高速列车优化运行研究
高速列车
优化运行
人群搜索算法
速度曲线
迷宫搜索算法的比较研究
搜救机器人
迷宫搜索
深度优先搜索算法
A*算法
基于蚁群算法优化的布谷鸟搜索算法
Levy飞行
布谷鸟搜索算法
蚁群优化算法
鸟巢位置更新策略
基于和声搜索算法的应急资源筹集优化
和声搜索
应急资源
筹集优化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 LUCENE搜索算法剖析及优化研究
来源期刊 图书馆杂志 学科
关键词 Lucene 搜索算法 向量空间模型 TF-IDF 离散随机最优化
年,卷(期) 2014,(12) 所属期刊栏目 专题
研究方向 页码范围 17-23
页数 7页 分类号
字数 语种 中文
DOI 10.13663/j.cnki.lj.2014.12.003
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 任树怀 6 13 1.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (25)
共引文献  (105)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(5)
  • 参考文献(0)
  • 二级参考文献(5)
2008(6)
  • 参考文献(0)
  • 二级参考文献(6)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(3)
  • 参考文献(1)
  • 二级参考文献(2)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Lucene 搜索算法
向量空间模型
TF-IDF
离散随机最优化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
图书馆杂志
月刊
1000-4254
31-1108/G2
16开
上海市长乐路746号
4-332
1982
chi
出版文献量(篇)
6452
总下载数(次)
6
相关基金
国家社会科学基金
英文译名:Philosophy and Social Science Foundation of China
官方网址:http://www.npopss-cn.gov.cn/
项目类型:重点项目
学科类型:马列·科社
论文1v1指导