基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
研究了中文分词技术的原理,比较了现有分词器的速度和准确性。通过研究开源搜索引擎Nutch的架构和工作流程,分析了源代码,在Nutch加入JE中文分词器,实现了Nutch的本土化。
推荐文章
Nutch中文分词的研究和改进
Nutch
搜索引擎
中文分词
Paoding's Knives
Nutch中庖丁解牛中文分词的实现与评测
中文分词
评分机制
庖丁解牛
基于.NET的中文分词系统设计与实现
中文分词
.NET
语料库
最大匹配算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 中文分词技术的研究及在Nutch中的实现
来源期刊 科技信息 学科 工学
关键词 Nutch 中文分词 搜索引擎
年,卷(期) 2011,(19) 所属期刊栏目 本刊重稿
研究方向 页码范围 I0038-I0039
页数 1页 分类号 TP391
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Nutch
中文分词
搜索引擎
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
科技信息(学术版)
旬刊
chi
出版文献量(篇)
33663
总下载数(次)
51
总被引数(次)
50452
论文1v1指导