基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
Hadoop分布式文件系统(HDFS)设计之初是针对大文件的处理,但无法高效地针对小文件进行存储,因此提出了一种基于关联规则挖掘的高效的小文件存储方法-ARMFS.ARMFS通过对Hadoop系统的审计日志进行关联规则挖掘,获得小文件间的关联性,通过文件合并算法将小文件合并存储至HDFS;在请求HDFS文件时,根据关联规则挖掘得到的高频访问表和预取机制表提出预取算法来进一步提高文件访问效率.实验结果表明,ARMFS方法明显提高了NameNode的内存使用效率,对于小文件的下载速度和访问效率的改善十分有效.
推荐文章
基于NoSQL的海量航空物流小文件分布式多级存储方法
小文件
Redis
HDFS
多级存储
预取机制
国产化环境下的海量小文件数据分布式存储技术
国产化环境
海量小文件数据
数据合并
数据迁移
分布式存储技术
基于隐私保护的分布式关联规则数据挖掘
隐私保护
关联规则
数据挖掘
分布式
分布式环境基于相似度的关联规则挖掘模型的研究
数据挖掘
关联规则
相似度
分布式系统
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于关联规则挖掘的分布式小文件存储方法
来源期刊 华东理工大学学报(自然科学版) 学科 工学
关键词 HDFS 关联规则挖掘 小文件关联性 预取
年,卷(期) 2016,(5) 所属期刊栏目 研究论文
研究方向 页码范围 708-714
页数 7页 分类号 TP316.4
字数 5150字 语种 中文
DOI 10.14135/j.cnki.1006-3080.2016.05.019
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郭卫斌 华东理工大学信息科学与工程学院 27 97 7.0 8.0
2 范贵生 华东理工大学信息科学与工程学院 47 341 10.0 17.0
3 钱能武 华东理工大学信息科学与工程学院 1 9 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (9)
参考文献  (4)
节点文献
引证文献  (9)
同被引文献  (28)
二级引证文献  (4)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(5)
  • 引证文献(5)
  • 二级引证文献(0)
2018(4)
  • 引证文献(3)
  • 二级引证文献(1)
2019(3)
  • 引证文献(1)
  • 二级引证文献(2)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
HDFS
关联规则挖掘
小文件关联性
预取
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
华东理工大学学报(自然科学版)
双月刊
1006-3080
31-1691/TQ
16开
上海市梅陇路130号
4-382
1957
chi
出版文献量(篇)
3399
总下载数(次)
2
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导