基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
索引技术是搜索引擎的核心技术之一,索引技术的好坏直接影响到搜索引擎的查准率以及对用户的响应速度.Lucene是一个优秀的全文检索引擎架构,采用高度优化的倒排索引结构并支持增量索引.但在实际应用Lucene时存在一个值得关注的问题:随着被索引文件的增多,索引时间成线性增长,导致建索引的过程会影响搜索体验;在搜索引擎应用中,当索引文件量达到一定等级时,搜索引擎就遇到性能瓶颈.在深入分析和研究Lucene索引机制的基础上,采用以内存为缓冲区建索引文件的分布式并行索引技术形成了一个可扩展的搜索引擎解决方案,极大地缓解了建索引给搜索带来的瓶颈问题.
推荐文章
基于ProActive的分布式并行网页索引算法
倒排索引
分布式并行
中间件
基于DPR树的分布式并行空间索引机制的研究
空间数据库
空间索引
并行索引
DPR树
基于Lucene.Net 的分布式全文检索系统
Lucene
Net
.NET
Remoting
分布式
全文检索
全文索引
一种基于MapReduce的分布式索引方法
海量文本
分布式
索引
MapReduce
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Lucene的分布式并行索引
来源期刊 计算机技术与发展 学科 工学
关键词 索引技术 Lucene 搜索引擎 分布式并行索引
年,卷(期) 2011,(2) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 123-126
页数 分类号 TP311
字数 2627字 语种 中文
DOI 10.3969/j.issn.1673-629X.2011.02.032
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐小乐 重庆交通大学信息科学与工程学院 5 46 3.0 5.0
2 何友全 重庆交通大学信息科学与工程学院 24 131 6.0 11.0
3 徐澄 重庆交通大学管理学院 3 45 3.0 3.0
4 唐华姣 重庆交通大学信息科学与工程学院 3 45 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (1)
共引文献  (5)
参考文献  (6)
节点文献
引证文献  (26)
同被引文献  (29)
二级引证文献  (10)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(3)
  • 参考文献(3)
  • 二级参考文献(0)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(6)
  • 引证文献(6)
  • 二级引证文献(0)
2013(5)
  • 引证文献(5)
  • 二级引证文献(0)
2014(5)
  • 引证文献(5)
  • 二级引证文献(0)
2015(3)
  • 引证文献(3)
  • 二级引证文献(0)
2016(6)
  • 引证文献(2)
  • 二级引证文献(4)
2017(3)
  • 引证文献(3)
  • 二级引证文献(0)
2018(3)
  • 引证文献(1)
  • 二级引证文献(2)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
索引技术
Lucene
搜索引擎
分布式并行索引
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导