基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
中文自动分词技术是许多中文智能领域尤其是中文信息的数据净化和数据挖掘的基础技术,而分词词典又是影响到中文自动分词的重要因素.本文针对中文地址数据净化和挖掘的具体需要提出了一种新的词典机制,即基于首字HASH,逐字二分和变型B-树的词典,从而明显提高了对短词的处理速度.
推荐文章
基于词典和词频的中文分词方法
中文分词
歧义消除
词频
基于二字词位图表的汉语自动分词词典机制
汉语自动分词
分词词典机制
二字词检测位图表
一种基于B-树的IPv6路由查找算法
IPv6
路由表
查找算法
B-树
多次Hash自动分词算法
自动分词
词典
中文分词
时间复杂度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于变型B-树的中文自动分词词典机制
来源期刊 技术与市场(上半月) 学科 工学
关键词 分词 B-树 二分查找
年,卷(期) 2007,(4) 所属期刊栏目 网络技术
研究方向 页码范围 37-38
页数 2页 分类号 TP2
字数 1486字 语种 中文
DOI 10.3969/j.issn.1006-8554.2007.04.040
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴昊 四川大学计算机学院 33 389 11.0 19.0
2 潘无名 四川大学计算机学院 5 12 2.0 3.0
3 王硕 四川大学计算机学院 8 65 3.0 8.0
4 杨博 四川大学计算机学院 16 28 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (48)
共引文献  (221)
参考文献  (6)
节点文献
引证文献  (1)
同被引文献  (6)
二级引证文献  (0)
1987(2)
  • 参考文献(0)
  • 二级参考文献(2)
1989(2)
  • 参考文献(0)
  • 二级参考文献(2)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(3)
  • 参考文献(0)
  • 二级参考文献(3)
1996(5)
  • 参考文献(1)
  • 二级参考文献(4)
1997(5)
  • 参考文献(0)
  • 二级参考文献(5)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(5)
  • 参考文献(0)
  • 二级参考文献(5)
2000(7)
  • 参考文献(1)
  • 二级参考文献(6)
2001(9)
  • 参考文献(1)
  • 二级参考文献(8)
2002(6)
  • 参考文献(1)
  • 二级参考文献(5)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
分词
B-树
二分查找
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
技术与市场
月刊
1006-8554
51-1450/T
大16开
四川省成都市
62-125
1980
chi
出版文献量(篇)
29073
总下载数(次)
69
论文1v1指导