基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
HDFS(Hadoop distributed file system)作为面向数据追加和读取优化的开源分布式文件系统,具备可移植、高容错和可大规模水平扩展的特性.经过10余年的发展,HDFS已经广泛应用于大数据的存储.作为存储海量数据的底层平台,HDFS存储了海量的结构化和非结构化数据,支撑着复杂查询分析、交互式分析、详单查询、Key-Value读写和迭代计算等丰富的应用场景.HDFS的性能问题将影响其上所有大数据系统和应用,因此,对HDFS存储性能的优化至关重要.介绍了HDFS的原理和特性,对已有HDFS的存储及优化技术,从文件逻辑结构、硬件设备和应用负载这3个维度进行了归纳和总结.综述了近年来HDFS存储和优化相关研究.未来,随着HDFS上层应用的日益丰富和底层硬件平台的发展,基于异构平台的数据存储、面向应用负载的自适应存储优化以及结合机器学习的存储优化技术将成为未来研究的主要方向.
推荐文章
存储系统重构优化技术研究
纠删编码存储系统
重构技术
存储可靠性
数据可用性
机械产品协同优化设计研究综述
综述
协同优化
问题分解
协同优化算法
性能函数快速分析
一种基于HDFS小文件存储优化方案
Hadoop
HDFS
小文件
缓存
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 HDFS存储和优化技术研究综述
来源期刊 软件学报 学科 工学
关键词 HDFS 分布式文件系统 存储系统优化 数据分析
年,卷(期) 2020,(1) 所属期刊栏目 数据库技术
研究方向 页码范围 137-161
页数 25页 分类号 TP311
字数 25870字 语种 中文
DOI 10.13328/j.cnki.jos.005872
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (34)
共引文献  (89)
参考文献  (13)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(3)
  • 参考文献(2)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(9)
  • 参考文献(1)
  • 二级参考文献(8)
2014(8)
  • 参考文献(2)
  • 二级参考文献(6)
2015(6)
  • 参考文献(0)
  • 二级参考文献(6)
2016(7)
  • 参考文献(4)
  • 二级参考文献(3)
2017(3)
  • 参考文献(1)
  • 二级参考文献(2)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2020(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
HDFS
分布式文件系统
存储系统优化
数据分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导