基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了提高数据的可用性和集群的整体性能,目前的HDFS( Hadoop Distributed File System)采用了副本数目固定的副本放置技术,然而由于文件热度存在较大差异,对那些具有较高热度文件的访问将影响作业的执行。为克服上述问题,本文提出一种基于预测的热点数据副本因子决策算法。根据数据的最近访问特征,基于灰色预测技术,采用马尔科夫预测模型修正因数据波动和突发访问造成的预测偏差,获取文件的未来访问热度,并基于预测值建立有限通道服务模型,寻找满足用户需求的最小副本因子。实验表明,较之现有的副本管理策略和基于实时热度调整副本因子策略,本策略可以有效减少热点数据的访问冲突,减少热点数据作业的执行时间和网络负载。
推荐文章
基于热点数据块的动态副本调整策略
访问频率
副本调整阀值
热点数据块
动态调整策略
数据访问效率
集群存储资源利用率
基于重复热点数据的CF广播结构改进算法
移动计算
数据广播
CF索引树
广播结构
HDFS动态副本因子的优化研究
云计算
HDFS
动态副本因子
访问热度
时间局部性
基于访问趋势的热点副本创建策略
数据网格
副本优化
热点副本
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于预测的云计算热点数据副本因子决策算法
来源期刊 计算机与现代化 学科 工学
关键词 热点数据 副本管理 云计算 Hadoop 灰色预测 生灭过程
年,卷(期) 2015,(2) 所属期刊栏目
研究方向 页码范围 62-66,72
页数 6页 分类号 TP274
字数 5115字 语种 中文
DOI 10.3969/j.issn.1006-2475.2015.02.014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杜庆伟 南京航空航天大学计算机科学与技术学院 18 105 8.0 9.0
2 张松 南京航空航天大学计算机科学与技术学院 3 21 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (77)
共引文献  (265)
参考文献  (6)
节点文献
引证文献  (10)
同被引文献  (23)
二级引证文献  (3)
1962(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(5)
  • 参考文献(0)
  • 二级参考文献(5)
2007(6)
  • 参考文献(0)
  • 二级参考文献(6)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(17)
  • 参考文献(0)
  • 二级参考文献(17)
2010(16)
  • 参考文献(0)
  • 二级参考文献(16)
2011(12)
  • 参考文献(0)
  • 二级参考文献(12)
2012(8)
  • 参考文献(4)
  • 二级参考文献(4)
2013(2)
  • 参考文献(1)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(7)
  • 引证文献(7)
  • 二级引证文献(0)
2019(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
热点数据
副本管理
云计算
Hadoop
灰色预测
生灭过程
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与现代化
月刊
1006-2475
36-1137/TP
大16开
南昌市井冈山大道1416号
44-121
1985
chi
出版文献量(篇)
9036
总下载数(次)
25
总被引数(次)
56782
论文1v1指导