基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
探讨基于压缩倒排文件的中文全文检索技术,包括数据压缩方法、存储、检索与排名机制.借助中科院的商精度ICTCLAS中文分词系统,采用C++/STL语言仿真实现了一个中文全文检索系统.该文列出部分关键代码,利用搜狗实验室提供的数据进行实验.通过改进压缩算法,系统的磁盘利用率提高了近80%.
推荐文章
基于Java的数据加密压缩技术在安全文件系统中的应用
Java
数据加密
数据压缩
安全文件系统
基于倒排文件中一种性能模型的研究
倒排文件
搜索引擎
性能模型
信息检索
倒排索引压缩及在RDBMS全文检索中的实现
全文检索
倒排索引
索引压缩
编码
电子公文的全文检索系统构建
全文检索
汉语分词
PDF
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于压缩倒排文件的中文全文检索仿真系统
来源期刊 计算机工程 学科 工学
关键词 中文全文检索 压缩倒排文件 排名
年,卷(期) 2008,(9) 所属期刊栏目 软件技术与数据库
研究方向 页码范围 64-66
页数 3页 分类号 TP391
字数 3800字 语种 中文
DOI 10.3969/j.issn.1000-3428.2008.09.023
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 宋懿 上海交通大学计算机科学与工程系 1 4 1.0 1.0
2 国德峰 上海交通大学计算机科学与工程系 2 7 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (4)
同被引文献  (0)
二级引证文献  (0)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2008(1)
  • 引证文献(1)
  • 二级引证文献(0)
2009(2)
  • 引证文献(2)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
中文全文检索
压缩倒排文件
排名
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导