基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对现有的Sparse Indexing方法不能有效处理小文件备份负载的问题,提出了一种以Broder扩展定理为理论依据的最小特征采样算法,该算法可以对不同形式的备份负载进行有效的特征采样。在此算法的基础上,设计了一种多负载重复数据消除方法,该方法通过对备份负载进行特征采样,仅在内存中维护完整索引的一个很小的子集,并通过批量读入分块标识符,摊销了磁盘访问开销,提高了吞吐量。实验结果表明,该方法对混合备份负载的压缩比是Sparse Indexing的2.04倍,而吞吐量与Sparse Indexing相当。该方法适用于需要处理多种形式备份负载的高性能重复数据消除系统。
推荐文章
结合图像特征的多视拼接数据的消冗处理
多视拼接
包围盒
重叠区域
冗余点
K近邻
DAISY特征描述子
相似度
基于Neyman-Pearson信号消噪方法的改进
小波变换
Neyman-Pearson准则
3δ准则
基于负载预测的HDFS动态负载均衡改进算法
负载均衡
二次指数
负载预测
动态阈值
动态均衡
基于ipv6和多副本的负载平衡方法
负载平衡
结构化p2p
Chord
Ipv6
多副本
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于改进Sparse Indexing的多负载消冗方法
来源期刊 电子科技大学学报 学科 工学
关键词 重复数据消除 磁盘瓶颈 最小特征采样 稀疏索引 吞吐量
年,卷(期) 2013,(5) 所属期刊栏目 计算机工程与应用
研究方向 页码范围 734-739
页数 6页 分类号 TP309.3
字数 5544字 语种 中文
DOI 10.3969/j.issn.1001-0548.2013.05.017
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 秦志光 电子科技大学计算机科学与工程学院 262 3157 26.0 46.0
3 杨磊 电子科技大学计算机科学与工程学院 14 52 5.0 6.0
5 王灿 电子科技大学计算机科学与工程学院 9 36 4.0 5.0
13 杨皓 电子科技大学计算机科学与工程学院 2 4 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (83)
参考文献  (3)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
重复数据消除
磁盘瓶颈
最小特征采样
稀疏索引
吞吐量
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子科技大学学报
双月刊
1001-0548
51-1207/T
大16开
成都市成华区建设北路二段四号
62-34
1959
chi
出版文献量(篇)
4185
总下载数(次)
13
论文1v1指导