作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为在保证中文歧义包容和长度限制的同时提高中文全文检索的速率,在现有中文分词算法的基础上,提出了一种改进的中文分词算法.通过在算法中建立索引的过程建立文本中相关词与词库的映射,对词库进行改造,使之更好地与相关词进行映射,以便于实现中文分词.实验证明,改进的中文分词算法能降低检索耗时,是已有的分词算法的1/2和1/5,有效提高中文全文检索的速率.
推荐文章
CAD电子图管理系统中全文检索的研究
电子图管理系统
全文检索
中文分词
基于Lucene站内全文检索系统的设计与实现
全文检索
索引
Lucene
网站内部资料
基于Lucene的全文检索系统在SSRF-PDM的应用
上海光源(SSRF)
产品数据管理(PDM)
全文检索
Lucene
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 中文全文检索系统中基于分词技术的研究
来源期刊 吉林大学学报(信息科学版) 学科 工学
关键词 中文全文检索 中文分词 字索引
年,卷(期) 2013,(3) 所属期刊栏目 计算机科学与技术
研究方向 页码范围 320-323
页数 4页 分类号 TP311|G354
字数 2235字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘畅 吉林工商学院信息工程学院 32 41 4.0 4.0
2 张猛 吉林大学网络中心 21 88 4.0 9.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (49)
共引文献  (81)
参考文献  (7)
节点文献
引证文献  (4)
同被引文献  (9)
二级引证文献  (0)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(6)
  • 参考文献(0)
  • 二级参考文献(6)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(7)
  • 参考文献(0)
  • 二级参考文献(7)
2006(7)
  • 参考文献(0)
  • 二级参考文献(7)
2007(8)
  • 参考文献(1)
  • 二级参考文献(7)
2008(3)
  • 参考文献(1)
  • 二级参考文献(2)
2009(5)
  • 参考文献(5)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
中文全文检索
中文分词
字索引
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
吉林大学学报(信息科学版)
双月刊
1671-5896
22-1344/TN
大16开
长春市南湖大路5372号
1983
chi
出版文献量(篇)
2333
总下载数(次)
2
总被引数(次)
16807
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导