基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
最大匹配算法包括正向最大匹配和逆向最大匹配两种算法,是中文分词领域的基础性算法,目前被广泛应用于众多领域.文中在详细分析了最大匹配算法的优缺点的基础上,提出了一种改进的最大匹配分词算法.改进算法在分词前先对词库进行了规范化预处理,分词时由汉字检索到该字开头的词组,再按词组长度由长到短的顺序使用传统最大匹配算法检索词库.目的是解决传统方法匹配效率低下和不能切分长词的问题.经算法分析结果表明,改进的算法较传统的最大匹配算法高效,分词能力更强.
推荐文章
一种改进的长词优先逆向最大匹配分词消歧策略
中文分词
逆向最大匹配算法
单字率
词频
一种快速Web中文分词算法的研究
Web分词
中文分词
分簇存储
近邻匹配
一种改进的中文分词正向最大匹配算法
中文分词
分词词典
正向最大匹配算法
中文分词歧义识别算法的优化
中文分词
逆向最大匹配算法
歧义识别
算法优化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种改进的最大匹配中文分词算法
来源期刊 计算机技术与发展 学科 工学
关键词 最大匹配 索引 词库 分词
年,卷(期) 2011,(10) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 92-94,98
页数 分类号 TP391.1
字数 3402字 语种 中文
DOI 10.3969/j.issn.1673-629X.2011.10.024
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 闻玉彪 云南大学信息学院 2 65 2.0 2.0
2 贾时银 云南大学信息学院 4 83 4.0 4.0
3 邓世昆 云南大学信息学院 18 145 7.0 12.0
4 李远方 云南大学信息学院 4 99 4.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (134)
共引文献  (217)
参考文献  (11)
节点文献
引证文献  (37)
同被引文献  (92)
二级引证文献  (134)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(2)
  • 参考文献(0)
  • 二级参考文献(2)
1988(4)
  • 参考文献(0)
  • 二级参考文献(4)
1989(7)
  • 参考文献(0)
  • 二级参考文献(7)
1990(5)
  • 参考文献(0)
  • 二级参考文献(5)
1991(5)
  • 参考文献(0)
  • 二级参考文献(5)
1992(6)
  • 参考文献(0)
  • 二级参考文献(6)
1993(3)
  • 参考文献(0)
  • 二级参考文献(3)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(5)
  • 参考文献(0)
  • 二级参考文献(5)
1996(8)
  • 参考文献(0)
  • 二级参考文献(8)
1997(19)
  • 参考文献(0)
  • 二级参考文献(19)
1998(12)
  • 参考文献(1)
  • 二级参考文献(11)
1999(11)
  • 参考文献(0)
  • 二级参考文献(11)
2000(10)
  • 参考文献(0)
  • 二级参考文献(10)
2001(16)
  • 参考文献(1)
  • 二级参考文献(15)
2002(12)
  • 参考文献(1)
  • 二级参考文献(11)
2003(5)
  • 参考文献(0)
  • 二级参考文献(5)
2004(4)
  • 参考文献(1)
  • 二级参考文献(3)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(3)
  • 参考文献(2)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(3)
  • 参考文献(3)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(7)
  • 引证文献(7)
  • 二级引证文献(0)
2013(13)
  • 引证文献(5)
  • 二级引证文献(8)
2014(15)
  • 引证文献(4)
  • 二级引证文献(11)
2015(27)
  • 引证文献(3)
  • 二级引证文献(24)
2016(20)
  • 引证文献(4)
  • 二级引证文献(16)
2017(31)
  • 引证文献(7)
  • 二级引证文献(24)
2018(38)
  • 引证文献(6)
  • 二级引证文献(32)
2019(16)
  • 引证文献(0)
  • 二级引证文献(16)
2020(4)
  • 引证文献(1)
  • 二级引证文献(3)
研究主题发展历程
节点文献
最大匹配
索引
词库
分词
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导