基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
由于现代社会飞速发展,一些新的名词不断出现,在已有的字符串匹配的分词方法中,大部分的词典是固定的,如果出现新的词,那么就不能被正确识别出来.由此该文提出了渐进式丰富词典的分词方法,把那些不能正确分出来的字符串,利用统计词频的方法记录下来,如果词频达到一定阈值,就可以把它认为是新词,可以把它加入到词典中,使得词典动态的增加.实验证明,该方法在保证分词速度不受影响的基础上,可以提高分词的精度.
推荐文章
基于词典和词频的中文分词方法
中文分词
歧义消除
词频
基于SNA-NK模型的企业渐进式创新绩效提升路径研究
渐进式创新
技术创新
社会网络分析
NK模型
适应度景观
基于数字水印的渐进式可视密码方案
可视密码
渐进式
数字水印
不扩展分享
基于HyperSizer的复合材料舱门结构渐进式优化设计
复合材料
舱门
渐进式优化
HyperSizer
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于渐进式丰富词典的分词方法研究
来源期刊 计算机工程与应用 学科 工学
关键词 渐进式丰富词典 字符串匹配分词方法 统计分词方法
年,卷(期) 2006,(32) 所属期刊栏目 数据库与信息处理
研究方向 页码范围 164-166
页数 3页 分类号 TP311
字数 3235字 语种 中文
DOI 10.3321/j.issn:1002-8331.2006.32.049
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 袁方 河北大学数学与计算机科学学院 55 1249 17.0 34.0
2 杨柳 河北大学数学与计算机科学学院 44 134 6.0 10.0
6 霍亮 保定金融高等专科学校计算机系 2 9 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (49)
参考文献  (4)
节点文献
引证文献  (6)
同被引文献  (3)
二级引证文献  (7)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2008(2)
  • 引证文献(2)
  • 二级引证文献(0)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2010(1)
  • 引证文献(0)
  • 二级引证文献(1)
2011(3)
  • 引证文献(0)
  • 二级引证文献(3)
2013(3)
  • 引证文献(1)
  • 二级引证文献(2)
2014(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
渐进式丰富词典
字符串匹配分词方法
统计分词方法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导