原文服务方: 计算机应用研究       
摘要:
由于EB(extreme binning)使用文件的最小块签名作为文件的特征,它不适合处理主要包括小文件的数据负载,会导致较差的重复数据删除率.为了改进EB,提出了相似索引.它把相似哈希作为文件的特征,是一种适用于以小文件为主的数据负载的重复数据删除的二级索引.实验结果表明,相似索引的重复数据删除率比EB高24.8%;相似索引的内存使用量仅仅是EB的0.265%.与EB相比,相似索引需要更少的存储使用量和内存使用量.
推荐文章
面向大数据存储的HBase二级索引设计
计算机软件
HBase
二级索引
聚集
转义
重复数据删除中的无向图遍历分组预测方法
重复数据删除
分组预测
大规模存储系统
一种云存储系统中重复数据删除机制
云存储
重复数据删除
数据副本
一种适用于嵌入式数据库的新索引机制
嵌入式数据库
索引机制
哈希冲突链
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 相似索引:适用于重复数据删除的二级索引
来源期刊 计算机应用研究 学科
关键词 重复数据删除 相似哈希 相似索引 块查找磁盘瓶颈问题 二级索引
年,卷(期) 2013,(12) 所属期刊栏目 算法研究探讨
研究方向 页码范围 3614-3617
页数 4页 分类号 TP301.6
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2013.12.025
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 蒋泽军 西北工业大学计算机学院 137 959 14.0 24.0
2 张志珂 西北工业大学计算机学院 3 4 1.0 2.0
3 蔡小斌 西北工业大学计算机学院 4 17 2.0 4.0
4 彭成章 西北工业大学计算机学院 5 7 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (3)
同被引文献  (1)
二级引证文献  (5)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
2018(4)
  • 引证文献(1)
  • 二级引证文献(3)
研究主题发展历程
节点文献
重复数据删除
相似哈希
相似索引
块查找磁盘瓶颈问题
二级索引
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导