基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
汉语分词词典是中文信息处理系统的重要基础,词典算法设计的优劣直接关系着分词的速度和效率.分析了三种典型的分词词典结构,提出了一种具有三级索引的新词典结构,并提出了最大正向匹配的改进型匹配算法,从而降低了匹配过程的时间复杂度.最后通过实验,比较了三种典型词典结构与新词典结构的时间效率.实验结果表明,新词典结构具有更高的词典查询速度和分词速度,可以有效满足中文处理系统的需求.
推荐文章
基于词典和词频的中文分词方法
中文分词
歧义消除
词频
中文分词词典机制的研究
中文分词
词典机制
带词长整词二分词典
自扩充中文分词词典的研究与实现
词典
整词二分
TRIE索引树
自扩充算法
中文分词算法研究与分析
中文分词
字符串匹配分词
统计分词
理解分词
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 中文分词词典结构的研究与改进
来源期刊 计算机工程与应用 学科 工学
关键词 中文分词 正向最大匹配 词典 三级索引
年,卷(期) 2012,(23) 所属期刊栏目 数据库、信号与信息处理
研究方向 页码范围 139-142
页数 分类号 TP391
字数 3732字 语种 中文
DOI 10.3778/j.issn.1002-8331.2012.23.032
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张桂珠 江南大学物联网工程学院 33 196 9.0 12.0
2 叶继平 江南大学物联网工程学院 1 24 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (15)
共引文献  (188)
参考文献  (5)
节点文献
引证文献  (24)
同被引文献  (60)
二级引证文献  (50)
1987(3)
  • 参考文献(0)
  • 二级参考文献(3)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(5)
  • 参考文献(1)
  • 二级参考文献(4)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(2)
  • 引证文献(2)
  • 二级引证文献(0)
2014(7)
  • 引证文献(7)
  • 二级引证文献(0)
2015(8)
  • 引证文献(3)
  • 二级引证文献(5)
2016(9)
  • 引证文献(3)
  • 二级引证文献(6)
2017(15)
  • 引证文献(6)
  • 二级引证文献(9)
2018(17)
  • 引证文献(3)
  • 二级引证文献(14)
2019(11)
  • 引证文献(0)
  • 二级引证文献(11)
2020(5)
  • 引证文献(0)
  • 二级引证文献(5)
研究主题发展历程
节点文献
中文分词
正向最大匹配
词典
三级索引
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导