基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文提出了一种能更准确的反映两个汉字串之间相关程度的新概念--黏结度,并给出了其计算方法.该方法把需要计算相关程度的汉字串放在一个大环境中进行讨论,通过加入上下文信息来提高分词的准确度;另外,该方法在引用汉字词频时,增加了对动态词频的考虑,可以自动识别未登陆的专业词汇.文中同时给出了黏结度在分词领域中的应用实例.通过与前人提出的相关信息的方法相比较,这种计算方法能够解决分词中一些难于解决的问题并提高分词的精确度.
推荐文章
一种计算大数模逆运算的新方法
RSA算法
椭圆密码算法
模逆
RSA协处理器
Montgomery模乘
Montgomery模逆
计算CHNO和CHNOAl炸药爆速的一种新方法
CHNO类炸药
CHNOAl炸药
Kamlet方法
Urizar方法
计算混合原油凝点的一种新方法
混合原油
凝点
计算
数学模型
一种计算料斗曲线方程的新方法
对数曲线
曲线方程
壁面摩擦角
料仓
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种计算汉字串之间相关程度的新方法
来源期刊 中文信息学报 学科 工学
关键词 计算机应用 中文信息处理 黏结度 相关信息[5] 分词
年,卷(期) 2004,(4) 所属期刊栏目
研究方向 页码范围 55-59
页数 5页 分类号 TP391
字数 3609字 语种 中文
DOI 10.3969/j.issn.1003-0077.2004.04.009
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 周经野 湘潭大学信息工程学院 70 530 12.0 20.0
2 曹娟 湘潭大学信息工程学院 3 15 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (12)
同被引文献  (14)
二级引证文献  (38)
1995(3)
  • 参考文献(3)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2004(1)
  • 引证文献(1)
  • 二级引证文献(0)
2005(2)
  • 引证文献(2)
  • 二级引证文献(0)
2006(3)
  • 引证文献(3)
  • 二级引证文献(0)
2007(6)
  • 引证文献(3)
  • 二级引证文献(3)
2008(4)
  • 引证文献(0)
  • 二级引证文献(4)
2009(4)
  • 引证文献(1)
  • 二级引证文献(3)
2010(5)
  • 引证文献(0)
  • 二级引证文献(5)
2011(12)
  • 引证文献(2)
  • 二级引证文献(10)
2012(1)
  • 引证文献(0)
  • 二级引证文献(1)
2014(4)
  • 引证文献(0)
  • 二级引证文献(4)
2015(4)
  • 引证文献(0)
  • 二级引证文献(4)
2016(2)
  • 引证文献(0)
  • 二级引证文献(2)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
计算机应用
中文信息处理
黏结度
相关信息[5]
分词
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
相关基金
湖南省自然科学基金
英文译名:Natural Science Foundation of Hunan Province
官方网址:http://jj.hnst.gov.cn/
项目类型:一般面上项目
学科类型:
论文1v1指导