基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
预处理过程的词语粗切分,是整个中文词语分析的基础环节,对最终的召回率、准确率、运行效率起着重要的作用.词语粗分必须能为后续的过程提供少量的、高召回率的、中间结果.本文提出了一种基于N-最短路径方法的粗分模型,旨在兼顾高召回率和高效率.在此基础上,引入了词频的统计数据,对原有模型进行改进,建立了更实用的统计模型.针对人民日报一个月的语料库(共计185,192个句子),作者进行了粗分实验.按句子进行统计,2-最短路径非统计粗分模型的召回率为99.73%;在10-最短路径统计粗分模型中,平均6.12个粗分结果得到的召回率高达99.94%,比最大匹配方法高出15%,比以前最好的切词方法至少高出6.4%.而粗分结果数的平均值较全切分减少了64倍.实验结果表明:N-最短路径方法是一种预处理过程中实用、有效的的词语粗分手段.
推荐文章
基于最大匹配分词算法的中文词语粗分模型
最大匹配
粗分模型
中文分词
基于半空间的最短路径算法模型研究
最短路径
半空间
Dijkstra算法
基于层的双环网络G(N;h)的最短路径算法
双环网络
最短路径
树模结构
最优路由
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于N-最短路径方法的中文词语粗分模型
来源期刊 中文信息学报 学科 工学
关键词 N-最短路径方法 粗分 中文词语分析
年,卷(期) 2002,(5) 所属期刊栏目
研究方向 页码范围 1-7
页数 7页 分类号 TP391.2
字数 6254字 语种 中文
DOI 10.3969/j.issn.1003-0077.2002.05.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘群 中国科学院计算技术研究所软件实验室 85 2516 22.0 49.0
2 张华平 中国科学院计算技术研究所软件实验室 6 999 4.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (373)
同被引文献  (68)
二级引证文献  (1019)
1987(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2002(1)
  • 引证文献(1)
  • 二级引证文献(0)
2003(2)
  • 引证文献(2)
  • 二级引证文献(0)
2004(16)
  • 引证文献(13)
  • 二级引证文献(3)
2005(32)
  • 引证文献(20)
  • 二级引证文献(12)
2006(86)
  • 引证文献(34)
  • 二级引证文献(52)
2007(89)
  • 引证文献(29)
  • 二级引证文献(60)
2008(128)
  • 引证文献(42)
  • 二级引证文献(86)
2009(133)
  • 引证文献(47)
  • 二级引证文献(86)
2010(114)
  • 引证文献(26)
  • 二级引证文献(88)
2011(116)
  • 引证文献(29)
  • 二级引证文献(87)
2012(105)
  • 引证文献(21)
  • 二级引证文献(84)
2013(107)
  • 引证文献(26)
  • 二级引证文献(81)
2014(101)
  • 引证文献(12)
  • 二级引证文献(89)
2015(62)
  • 引证文献(15)
  • 二级引证文献(47)
2016(67)
  • 引证文献(12)
  • 二级引证文献(55)
2017(84)
  • 引证文献(16)
  • 二级引证文献(68)
2018(80)
  • 引证文献(18)
  • 二级引证文献(62)
2019(56)
  • 引证文献(9)
  • 二级引证文献(47)
2020(12)
  • 引证文献(0)
  • 二级引证文献(12)
研究主题发展历程
节点文献
N-最短路径方法
粗分
中文词语分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
相关基金
国家重点基础研究发展计划(973计划)
英文译名:National Basic Research Program of China
官方网址:http://www.973.gov.cn/
项目类型:
学科类型:农业
论文1v1指导