原文服务方: 计算技术与自动化       
摘要:
Hadoop分布式文件系统(HDFS)在大数据存储中具有优良的性能,适用于处理和存储大文件,但在海量小文件处理时性能显著下降,过多的小文件使得整个系统内存消耗过大.为了提高HDFS处理小文件的效率,改进了HDFS的存储方案,提出了海量小文件的存储优化方案.根据小文件之间的相关性进行分类,然后将同一类小文件合并上传,并生成索引文件,读取时采用客户端缓存机制以提高访问效率.实验结果表明,该方案在数据迅速增长的情况下能有效提高小文件访问效率,降低系统内存开销,提高HDFS处理海量小文件的性能.
推荐文章
一种面向HDFS中海量小文件的存取优化方法
海量小文件
文件相关性
合并
预取
一种提高云存储中小文件存储效率的方案
云存储
小文件
存储效率
负载预测
基于HDFS的云存储系统小文件优化方案
Hadoop分布式文件系统
小文件
预提取
随机化
动态调整
基于NoSQL的海量航空物流小文件分布式多级存储方法
小文件
Redis
HDFS
多级存储
预取机制
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于HDFS小文件存储优化方案
来源期刊 计算技术与自动化 学科
关键词 Hadoop HDFS 小文件 缓存
年,卷(期) 2017,(3) 所属期刊栏目 计算机软件及应用
研究方向 页码范围 134-138
页数 5页 分类号 TP391
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张晓丽 西安航空学院计算机学院 15 38 5.0 5.0
2 滑亚慧 西安航空学院计算机学院 3 8 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (43)
参考文献  (2)
节点文献
引证文献  (5)
同被引文献  (13)
二级引证文献  (1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
Hadoop
HDFS
小文件
缓存
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算技术与自动化
季刊
1003-6199
43-1138/TP
16开
1982-01-01
chi
出版文献量(篇)
2939
总下载数(次)
0
总被引数(次)
14675
论文1v1指导