基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于词典的中文自动分词是中文信息处理的基础.按照使用计算机缓存的优化原则,分析了几种典型的分词词典机制,指出了其中的一些问题.改进了整词二分法,极大地提高了速度.结合哈希索引和PATR IC IA tree搜索算法,提出了一个综合最优化的中文分词系统.
推荐文章
基于词典和词频的中文分词方法
中文分词
歧义消除
词频
中文分词算法研究与分析
中文分词
字符串匹配分词
统计分词
理解分词
中文分词模型词典融入方法比较
中文分词
条件随机场
柱搜索
领域自适应
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 几种基于词典的中文分词算法评价
来源期刊 贵州科学 学科 工学
关键词 中文信息处理 自动分词 分词词典 缓存优化
年,卷(期) 2008,(3) 所属期刊栏目
研究方向 页码范围 1-8
页数 8页 分类号 TP391.1
字数 7542字 语种 中文
DOI 10.3969/j.issn.1003-6563.2008.03.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 马新强 贵州大学信息工程学院 14 105 4.0 10.0
2 李丹宁 32 145 5.0 10.0
3 王保华 贵州大学信息工程学院 13 170 4.0 13.0
4 李丹 11 51 4.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (161)
参考文献  (4)
节点文献
引证文献  (16)
同被引文献  (18)
二级引证文献  (39)
1987(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(4)
  • 参考文献(1)
  • 二级参考文献(3)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2009(2)
  • 引证文献(2)
  • 二级引证文献(0)
2010(4)
  • 引证文献(4)
  • 二级引证文献(0)
2011(2)
  • 引证文献(2)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(3)
  • 引证文献(2)
  • 二级引证文献(1)
2014(5)
  • 引证文献(2)
  • 二级引证文献(3)
2015(4)
  • 引证文献(1)
  • 二级引证文献(3)
2016(3)
  • 引证文献(1)
  • 二级引证文献(2)
2017(6)
  • 引证文献(0)
  • 二级引证文献(6)
2018(10)
  • 引证文献(1)
  • 二级引证文献(9)
2019(13)
  • 引证文献(0)
  • 二级引证文献(13)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
中文信息处理
自动分词
分词词典
缓存优化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
贵州科学
双月刊
1003-6563
52-1076/N
大16开
贵州省贵阳市陕西路1号
1983
chi
出版文献量(篇)
2122
总下载数(次)
1
总被引数(次)
8235
论文1v1指导