基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
通过分析词的结合模式,提出无词典分词模型,并对该模型进行实验测试.测试结果表明,无词典分词模型能够满足快速分词的要求.
推荐文章
基于词典和词频的中文分词方法
中文分词
歧义消除
词频
中文分词模型词典融入方法比较
中文分词
条件随机场
柱搜索
领域自适应
基于SVM的词频统计中文分词研究
中文分词
词频统计
互信息
支持向量机
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于统计的无词典分词方法
来源期刊 广西科学院学报 学科 工学
关键词 自动分词 无词典分词 词条过滤 词条统计
年,卷(期) 2002,(4) 所属期刊栏目
研究方向 页码范围 252-255,264
页数 5页 分类号 TP391.1
字数 3572字 语种 中文
DOI 10.3969/j.issn.1002-7378.2002.04.031
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 袁鼎荣 广西师范大学计算机科学系 25 252 8.0 15.0
2 钟智 广西师范大学计算机科学系 43 379 9.0 18.0
3 傅赛香 中国科学院计算技术研究所智能信息处理开放实验室 2 94 2.0 2.0
4 黄柏雄 广西师范大学计算机科学系 2 83 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (81)
同被引文献  (46)
二级引证文献  (183)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2003(1)
  • 引证文献(1)
  • 二级引证文献(0)
2004(3)
  • 引证文献(3)
  • 二级引证文献(0)
2005(10)
  • 引证文献(8)
  • 二级引证文献(2)
2006(24)
  • 引证文献(10)
  • 二级引证文献(14)
2007(26)
  • 引证文献(5)
  • 二级引证文献(21)
2008(27)
  • 引证文献(5)
  • 二级引证文献(22)
2009(33)
  • 引证文献(10)
  • 二级引证文献(23)
2010(23)
  • 引证文献(8)
  • 二级引证文献(15)
2011(25)
  • 引证文献(8)
  • 二级引证文献(17)
2012(11)
  • 引证文献(3)
  • 二级引证文献(8)
2013(17)
  • 引证文献(2)
  • 二级引证文献(15)
2014(18)
  • 引证文献(2)
  • 二级引证文献(16)
2015(8)
  • 引证文献(4)
  • 二级引证文献(4)
2016(10)
  • 引证文献(2)
  • 二级引证文献(8)
2017(10)
  • 引证文献(2)
  • 二级引证文献(8)
2018(9)
  • 引证文献(4)
  • 二级引证文献(5)
2019(5)
  • 引证文献(3)
  • 二级引证文献(2)
2020(4)
  • 引证文献(1)
  • 二级引证文献(3)
研究主题发展历程
节点文献
自动分词
无词典分词
词条过滤
词条统计
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
广西科学院学报
季刊
1002-7378
45-1075/N
大16开
广西南宁市大岭路98号
1982
chi
出版文献量(篇)
1934
总下载数(次)
0
总被引数(次)
9503
论文1v1指导