基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为通过构建高速的中文索引结构来提高Off-line模式的串匹配速度,提出了一种基于Bigram二级哈希的中文索引结构。该索引采用中文GB2312编码处理中文汉字,以中文Bigram项作为词汇项,并实现了基于二级哈希的词汇表存储结构。实验数据显示,本文索引结构虽然占用存储空间为词索引的2倍多,但其匹配速度是词索引的4倍多。结果表明本文索引在中文匹配中具有速度优势。
推荐文章
使用二级索引的中文分词词典
中文分词
二级索引
正向最大匹配
基于协处理器的HBase二级索引方法
HBase
二级索引
协处理器
ElasticSearch
面向大数据存储的HBase二级索引设计
计算机软件
HBase
二级索引
聚集
转义
基于二级索引结构的图压缩算法
二级索引
图压缩
键值结构
属性查询
邻居查询
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于Bigram二级哈希的中文索引结构
来源期刊 电子设计工程 学科 工学
关键词 串匹配 中文 倒排索引 Bigram
年,卷(期) 2014,(12) 所属期刊栏目 计算机技术与应用
研究方向 页码范围 1-4
页数 4页 分类号 TN91
字数 4090字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 孙德才 9 9 2.0 2.0
2 王晓霞 7 6 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (9)
共引文献  (10)
参考文献  (5)
节点文献
引证文献  (2)
同被引文献  (16)
二级引证文献  (9)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(2)
  • 参考文献(1)
  • 二级参考文献(1)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(3)
  • 引证文献(2)
  • 二级引证文献(1)
2019(5)
  • 引证文献(0)
  • 二级引证文献(5)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
串匹配
中文
倒排索引
Bigram
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子设计工程
半月刊
1674-6236
61-1477/TN
大16开
西安市高新区高新路25号瑞欣大厦10A室
52-142
1994
chi
出版文献量(篇)
14564
总下载数(次)
54
总被引数(次)
54366
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导