基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
对分词检索算法n-Gram/2L的索引结构作了改进,在第二级倒排表中加入对文章标识的索引,提出一种基于Zigzag的分词检索算法n-Gram/2LZ(n-Gram/2L on Zigzag join).在对数据量较大的文章进行检索和索引时,该算法在保留原有算法特性的基础上进一步减少了索引冗余,降低了索引的存储量,同时对查询算法的优化降低了查询时的系统开销,并且减少索引中记录访问次数,提高了查询效率.
推荐文章
基于2-Gram的索引存储模型设计
2-Gram
索引
存储模型
基于规则和N-Gram算法的新词识别研究
新词识别
N-Gram算法
构词规则
中文分词
碎片库
召回率
基于N-gram算法的网络安全风险检测系统设计
网络安全
风险检测
N-gram算法
数据包检测
协同分析
特征匹配
基于N-Gram的文本去重方法研究
文本去重
文本特征
特征映射
中文信息处理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 n-Gram/2L索引结构的存储与时间优化算法
来源期刊 计算机工程与应用 学科 工学
关键词 算法 索引 n-gram 倒排表
年,卷(期) 2008,(5) 所属期刊栏目 数据库与信息处理
研究方向 页码范围 180-183
页数 4页 分类号 TP391.3
字数 4862字 语种 中文
DOI 10.3778/j.issn.1002-8331.2008.05.057
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄河 北京航空航天大学软件学院 30 279 7.0 16.0
2 胡玥 北京科技大学计算机科学系 13 102 4.0 10.0
3 刘庆文 北京科技大学计算机科学系 7 48 3.0 6.0
4 刘凤晨 北京航空航天大学软件学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (3)
同被引文献  (13)
二级引证文献  (28)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(4)
  • 引证文献(1)
  • 二级引证文献(3)
2017(12)
  • 引证文献(0)
  • 二级引证文献(12)
2018(9)
  • 引证文献(0)
  • 二级引证文献(9)
2019(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
算法
索引
n-gram
倒排表
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
相关基金
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导