基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
网络百科是一部在线百科全书,为用户提供了资源丰富、内容详实的网络查询工具.网络百科检索服务是基于SolrCloud搭建的检索平台,服务部署在集群上,具有集中式的信息配置、自动容错、近实时搜索和查询时自动负载均衡的特点.本文介绍了SolrCloud平台的搭建方案,结合数据特点设计了索引结构,增加了中文分词器和中文词表,提高了在创建索引和检索索引过程中的中文分词效果.在SolrCloud平台基础上,本文根据搜索引擎原理提出了搜索引擎优化方案,进一步提升了搜索效果.通过在创建索引时对关键字段设置多颗粒度分词模式,在检索索引时对不同颗粒度分词设置不同的权重,提高检索效果;通过挖掘数据内在的引用关系为文档质量评分,提高优质文档在搜索结果中的排名.实验数据表明,优化方法对网络百科检索服务效果有很大的提升.
推荐文章
维基百科链接网络实证分析
维基百科
无标度网络
bow-tie模型
百度百科合作网络的分形生长机制研究
百度百科
复杂网络
谱分析
多重分形
Hurst指数
融媒体时代百科全书出版的思考
融媒体时代
百科全书
数字化出版
维基百科人物关系知识网络的复杂性分析
维基百科
知识网络
复杂网络
人物关系
社团检测
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于SolrCloud的网络百科检索服务的实现
来源期刊 软件 学科 工学
关键词 计算机软件 搜索引擎优化 SolrCloud 中文分词
年,卷(期) 2015,(12) 所属期刊栏目 设计研究与应用
研究方向 页码范围 103-107
页数 5页 分类号 TP311
字数 4258字 语种 中文
DOI 10.3969/j.issn.1003-6970.2015.12.024
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 高占春 北京邮电大学计算机学院 6 21 3.0 4.0
2 郝强 北京邮电大学计算机学院 1 6 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (43)
共引文献  (49)
参考文献  (10)
节点文献
引证文献  (6)
同被引文献  (22)
二级引证文献  (6)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(4)
  • 参考文献(1)
  • 二级参考文献(3)
2009(3)
  • 参考文献(1)
  • 二级参考文献(2)
2010(5)
  • 参考文献(0)
  • 二级参考文献(5)
2011(7)
  • 参考文献(1)
  • 二级参考文献(6)
2012(10)
  • 参考文献(0)
  • 二级参考文献(10)
2013(8)
  • 参考文献(1)
  • 二级参考文献(7)
2014(5)
  • 参考文献(3)
  • 二级参考文献(2)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(6)
  • 引证文献(2)
  • 二级引证文献(4)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
计算机软件
搜索引擎优化
SolrCloud
中文分词
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件
月刊
1003-6970
12-1151/TP
16开
北京市3108信箱
1979
chi
出版文献量(篇)
9374
总下载数(次)
40
论文1v1指导