基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着当前网络信息资源的急剧膨胀,传统的检索系统已经难以在处理海量数据时提供高效的、可靠的服务.针对该情况,设计并实现一个基于Solr的分布式全文检索系统.系统通过网络爬虫抓取网页信息,将抓取的信息储存为文本文件;然后利用Solr索引处理模块,在多台计算机节点上并行创建索引,有效地提高系统建立索引的速度;系统通过Zookeeper管理集群,将搜索模块设计为分布式,有效地提高检索性能;最后设计了友好的用户界面.目前,系统可以在百万数据量的环境下稳定运行,具有较强的实用价值.
推荐文章
分布式数据检索系统的设计与实现
分布式数据检索
windows
反馈
容错机制
分布式海量文本检索系统研究
海量数据
全文检索
文本索引
海量加载
基于Lucene站内全文检索系统的设计与实现
全文检索
索引
Lucene
网站内部资料
用CORBA技术构建分布式图像检索系统
分布式
CORBA
ORB
图像检索
基于内容的图像检索
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Solr的分布式全文检索系统的研究与实现
来源期刊 计算机与现代化 学科 工学
关键词 全文检索 Solr 分布式 Zookeeper
年,卷(期) 2012,(11) 所属期刊栏目 网络与通信
研究方向 页码范围 171-176
页数 6页 分类号 TP311.133.1
字数 4535字 语种 中文
DOI 10.3969/j.issn.1006-2475.2012.11.042
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李戴维 华北计算技术研究所信息技术与应用系统部 4 80 4.0 4.0
2 李宁 华北计算技术研究所信息技术与应用系统部 8 60 3.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (20)
共引文献  (41)
参考文献  (5)
节点文献
引证文献  (49)
同被引文献  (70)
二级引证文献  (111)
1999(2)
  • 参考文献(1)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(3)
  • 引证文献(3)
  • 二级引证文献(0)
2014(6)
  • 引证文献(5)
  • 二级引证文献(1)
2015(11)
  • 引证文献(6)
  • 二级引证文献(5)
2016(24)
  • 引证文献(8)
  • 二级引证文献(16)
2017(36)
  • 引证文献(12)
  • 二级引证文献(24)
2018(41)
  • 引证文献(7)
  • 二级引证文献(34)
2019(28)
  • 引证文献(6)
  • 二级引证文献(22)
2020(11)
  • 引证文献(2)
  • 二级引证文献(9)
研究主题发展历程
节点文献
全文检索
Solr
分布式
Zookeeper
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与现代化
月刊
1006-2475
36-1137/TP
大16开
南昌市井冈山大道1416号
44-121
1985
chi
出版文献量(篇)
9036
总下载数(次)
25
总被引数(次)
56782
论文1v1指导