基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了一种改进的逐词匹配算法.该算法通过对非歧义字段切分,对人名地名进行判别,以及对伪歧义字段进行处理,使交集型歧义字段切分正确率有了大幅度提高.在5万汉字语料开放测试中,交集型歧义字段切分正确率可达98%以上.
推荐文章
一种规则与统计相结合的汉语分词方法
中文信息处理
分词
语料库
交集型歧义
一种快速Web中文分词算法的研究
Web分词
中文分词
分簇存储
近邻匹配
入侵检测中一种新的多模式匹配算法
入侵检测
多模式匹配
AC算法
Wu-Manber算法
AC-WM算法
一种实用的资源稀缺条件下的分词方法
分词
无监督分词
最大匹配
VE算法
间隔标注
资源
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 汉语分词中一种逐词匹配算法的研究
来源期刊 湖南城市学院学报(自然科学版) 学科 工学
关键词 汉语分词 歧义词 伪歧义字段 逐词匹配算法
年,卷(期) 2005,(1) 所属期刊栏目 计算机技术及应用
研究方向 页码范围 76-78
页数 3页 分类号 TP391
字数 3272字 语种 中文
DOI 10.3969/j.issn.1672-7304.2005.01.024
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 邓曙光 86 404 11.0 17.0
2 曾朝晖 10 38 2.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (19)
参考文献  (3)
节点文献
引证文献  (28)
同被引文献  (34)
二级引证文献  (234)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(3)
  • 参考文献(2)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(2)
  • 引证文献(2)
  • 二级引证文献(0)
2007(2)
  • 引证文献(2)
  • 二级引证文献(0)
2008(3)
  • 引证文献(3)
  • 二级引证文献(0)
2009(10)
  • 引证文献(2)
  • 二级引证文献(8)
2010(23)
  • 引证文献(3)
  • 二级引证文献(20)
2011(11)
  • 引证文献(2)
  • 二级引证文献(9)
2012(12)
  • 引证文献(2)
  • 二级引证文献(10)
2013(18)
  • 引证文献(3)
  • 二级引证文献(15)
2014(38)
  • 引证文献(1)
  • 二级引证文献(37)
2015(27)
  • 引证文献(3)
  • 二级引证文献(24)
2016(29)
  • 引证文献(3)
  • 二级引证文献(26)
2017(34)
  • 引证文献(2)
  • 二级引证文献(32)
2018(29)
  • 引证文献(0)
  • 二级引证文献(29)
2019(21)
  • 引证文献(0)
  • 二级引证文献(21)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
汉语分词
歧义词
伪歧义字段
逐词匹配算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
湖南城市学院学报(自然科学版)
双月刊
1672-7304
43-1428/TU
大16开
湖南省益阳市迎宾东路518号
1999
chi
出版文献量(篇)
3169
总下载数(次)
3
总被引数(次)
7130
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导