基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对传统文本索引技术空间消耗大、分词不准确等问题,设计并实现了高性能文本索引系统。该系统采用压缩的全文自索引算法,节省了空间开销,避免了自然语言分词方法的影响,配合通配符搜索算法扩展了模糊搜索的功能,在众核CPU高性能处理器上可实现多线程并行处理,提高了处理速度,整个系统的实现是基于Web方式的,可以跨平台运行。实验结果表明,该系统将文本索引的空间消耗降为原文本的50%左右,具有较高的实用价值。
推荐文章
高性能计算机资源管理系统改进设计与实现
高性能计算机
资源管理
系统改进
JQuery+Ajax
SSH
预处理
文本信息检索系统的设计与实现
信息检索
算法介绍
倒排索引
检索系统构建
快速注册
快速检索
测控系统中高性能实时集群的研究与实现
实时集群
可用性
网络传输
并行计算
单一系统映像
节点
负载平衡
基于高性能EPC网络的物流追溯信息系统设计与实现
EPC网络架构
RFID
EPCIS
ONS
物流追溯信息系统
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 高性能文本索引系统的设计与实现
来源期刊 中国科技论文 学科 工学
关键词 计算机应用 文本索引 全文索引 自索引 通配符搜索
年,卷(期) 2014,(1) 所属期刊栏目
研究方向 页码范围 92-95,107
页数 5页 分类号 TP391
字数 4841字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张宇 中国科学院信息工程研究所 212 2104 24.0 35.0
2 王春露 北京邮电大学计算机学院 17 142 7.0 11.0
3 刘燕兵 中国科学院信息工程研究所 20 149 7.0 11.0
4 路炜 中国科学院信息工程研究所 8 5 1.0 1.0
13 周美孜 中国人民大学信息学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (1)
同被引文献  (5)
二级引证文献  (0)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
计算机应用
文本索引
全文索引
自索引
通配符搜索
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国科技论文
月刊
2095-2783
10-1033/N
大16开
北京市海淀区中关村大街35号教育部科技发展中心
2006
chi
出版文献量(篇)
4942
总下载数(次)
10
总被引数(次)
14783
论文1v1指导