基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
中文分词是中文文本处理和自然语言处理中最基本和最重要的研究,它效果的好坏直接影响到所在领域中进一步研究的效果.本文对于已有的基于词典,基于统计,基于理解的分词方法进行了详细的阐述和讨论,分析了它们的优点和不足,并且介绍了现在的难点,在此基础上,为中文分词的进一步发展提供了建议.
推荐文章
中文分词算法研究与分析
中文分词
字符串匹配分词
统计分词
理解分词
基于双数组Trie树中文分词研究
自然语言处理
双数组
Trie树
词典
分词
基于SVM的词频统计中文分词研究
中文分词
词频统计
互信息
支持向量机
基于词典和词频的中文分词方法
中文分词
歧义消除
词频
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 中文分词研究
来源期刊 软件 学科 工学
关键词 计算机应用 自然语言处理 中文分词
年,卷(期) 2012,(12) 所属期刊栏目 理论计算机科学
研究方向 页码范围 103-108
页数 6页 分类号 TP391.4
字数 7529字 语种 中文
DOI 10.3969/j.issn.1003-6970.2012.12.027
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐蔚然 北京邮电大学模式识别实验室 22 369 9.0 19.0
2 张黎 北京邮电大学信息与通信工程学院 4 45 2.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (53)
共引文献  (269)
参考文献  (14)
节点文献
引证文献  (34)
同被引文献  (25)
二级引证文献  (32)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(6)
  • 参考文献(0)
  • 二级参考文献(6)
2000(3)
  • 参考文献(1)
  • 二级参考文献(2)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(2)
  • 参考文献(2)
  • 二级参考文献(0)
2006(8)
  • 参考文献(0)
  • 二级参考文献(8)
2007(11)
  • 参考文献(2)
  • 二级参考文献(9)
2008(4)
  • 参考文献(1)
  • 二级参考文献(3)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(3)
  • 参考文献(1)
  • 二级参考文献(2)
2011(3)
  • 参考文献(3)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(2)
  • 引证文献(2)
  • 二级引证文献(0)
2014(7)
  • 引证文献(7)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(6)
  • 引证文献(3)
  • 二级引证文献(3)
2017(16)
  • 引证文献(9)
  • 二级引证文献(7)
2018(19)
  • 引证文献(7)
  • 二级引证文献(12)
2019(12)
  • 引证文献(3)
  • 二级引证文献(9)
2020(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
计算机应用
自然语言处理
中文分词
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件
月刊
1003-6970
12-1151/TP
16开
北京市3108信箱
1979
chi
出版文献量(篇)
9374
总下载数(次)
40
总被引数(次)
23629
论文1v1指导