基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
Lucene是一个高效的全文检索工具包,本文主要研究了Lucene的体系架构及其在中文检索上的应用.通过对基于最大匹配算法的中文分词器的设计与改进,并引入文本解析器与构建同义词词库引擎,使得Lucene对中文的检索更加个性化.通过检索结果的对比表明,改进后的中文分词器对检索功能的扩展有了极大的提高.并最终构建出了一个高效的中文全文检索系统.
推荐文章
基于.NET的中文分词系统设计与实现
中文分词
.NET
语料库
最大匹配算法
基于Lucene的中文分词方法设计与实现
中文分词
搜索引擎
Lucene
正向最大匹配算法
一种基于LUCENE的中文分词算法研究
全文检索
Lucene
中文分词
Lucene.net中文分词算法分析
Lucene
中文分词
Analyzer类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Lucene的中文分词器的改进与实现
来源期刊 微型机与应用 学科 工学
关键词 全文检索 中文分词器 文本解析器 最大匹配算法(MMSEG)
年,卷(期) 2015,(11) 所属期刊栏目 技术与方法
研究方向 页码范围 76-78,82
页数 4页 分类号 TP39
字数 3088字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郭淑琴 浙江工业大学信息工程学院 43 173 7.0 10.0
2 罗惠峰 浙江工业大学信息工程学院 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (54)
参考文献  (5)
节点文献
引证文献  (2)
同被引文献  (5)
二级引证文献  (2)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(3)
  • 参考文献(1)
  • 二级参考文献(2)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
全文检索
中文分词器
文本解析器
最大匹配算法(MMSEG)
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息技术与网络安全
月刊
2096-5133
10-1543/TP
大16开
北京市海淀区清华东路25号(北京927信箱)
82-417
1982
chi
出版文献量(篇)
10909
总下载数(次)
33
总被引数(次)
35987
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导