基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了解决传统的抽取、转换和加载工具处理数据仓库中海量数据的效率问题,设计并实现了基于Hadoop平台的分布式ETL系统.详细的探讨了渐变维度、雪花维度、大维度数据和事实数据的并行处理.实验结果表明,与Hive数据仓库相比,该分布式ETL系统在并行处理数据仓库中海量数据的问题上,具有更高的效率和扩展性.
推荐文章
大数据环境下Hadoop分布式系统的研究与设计
大数据
高并发
高存储
高扩展性和可用性
基于Wonderware平台的分布式报警系统的设计与实现
Wonderware
分布式报警系统
电力远动系统
信息过滤
Hadoop分布式的海量图像检索
Hadoop分布式
海量图像
SURF特征
K?Means聚类
检索
数据挖掘
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Hadoop平台的分布式ETL系统设计与实现
来源期刊 福建电脑 学科
关键词 Hadoop 分布式ETL 维度 事实 并行处理
年,卷(期) 2013,(11) 所属期刊栏目 应用与开发
研究方向 页码范围 111-114
页数 4页 分类号
字数 3561字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 孙莉 东华大学计算机科学与技术学院 56 452 12.0 17.0
2 何刚 东华大学计算机科学与技术学院 2 15 2.0 2.0
3 李晨翔 东华大学计算机科学与技术学院 1 6 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (5)
参考文献  (2)
节点文献
引证文献  (6)
同被引文献  (7)
二级引证文献  (1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(2)
  • 引证文献(2)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Hadoop
分布式ETL
维度
事实
并行处理
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
福建电脑
月刊
1673-2782
35-1115/TP
大16开
福州市华林邮局29号信箱
1985
chi
出版文献量(篇)
21147
总下载数(次)
86
总被引数(次)
44699
论文1v1指导