基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
汉语自动分词是汉语信息处理的前提,词典是汉语自动分词的基础,分词词典机制的优劣直接影响到中文分词的速度和效率.针对常用的分词方法--正向匹配分词法的特征,在已有整词二分词典的基础上加以改进,设计了一种基于Hash索引、二叉树以及动态一维数组结构的中文分词词典,相对于传统的基于Hash索引的分词词典,减小了词典的空间复杂度,提高了汉语分词的速度,最主要的是改进后的词典在增添新词时比以往的词典更为容易.
推荐文章
一种基于全Hash的整词二分词典机制
中文分词
Hash函数
整词二分
逐字二分
最大匹配
改进的二分法查找
查找
二分法
有序数列
算法
汉语文本自动分词算法的研究
自动分词
分词算法
字典
歧义切分
中文分词词典机制的研究
中文分词
词典机制
带词长整词二分词典
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种改进整词二分法的中文分词词典设计
来源期刊 信息技术 学科 工学
关键词 汉语分词 词典查询 中文信息处理
年,卷(期) 2009,(5) 所属期刊栏目 基金项目
研究方向 页码范围 40-42,45
页数 4页 分类号 TP391
字数 3307字 语种 中文
DOI 10.3969/j.issn.1009-2552.2009.05.014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 谭骏珊 中南林业科技大学计算机科学学院 31 174 7.0 12.0
2 吴惠雄 中南林业科技大学计算机科学学院 1 17 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (156)
参考文献  (2)
节点文献
引证文献  (17)
同被引文献  (39)
二级引证文献  (156)
1987(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(2)
  • 引证文献(2)
  • 二级引证文献(0)
2011(11)
  • 引证文献(5)
  • 二级引证文献(6)
2012(9)
  • 引证文献(1)
  • 二级引证文献(8)
2013(15)
  • 引证文献(2)
  • 二级引证文献(13)
2014(19)
  • 引证文献(3)
  • 二级引证文献(16)
2015(21)
  • 引证文献(0)
  • 二级引证文献(21)
2016(27)
  • 引证文献(2)
  • 二级引证文献(25)
2017(25)
  • 引证文献(2)
  • 二级引证文献(23)
2018(19)
  • 引证文献(0)
  • 二级引证文献(19)
2019(20)
  • 引证文献(0)
  • 二级引证文献(20)
2020(5)
  • 引证文献(0)
  • 二级引证文献(5)
研究主题发展历程
节点文献
汉语分词
词典查询
中文信息处理
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息技术
月刊
1009-2552
23-1557/TN
大16开
哈尔滨市南岗区黄河路122号
14-36
1977
chi
出版文献量(篇)
11355
总下载数(次)
31
总被引数(次)
47901
论文1v1指导