基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对传统数据抽取、转换及加载(ETL)工具集中式执行的不足,设计实现了一种基于Hadoop平台的分布式ETL系统.该系统采用分布式文件系统存储和映射-规约并行处理海量数据架构,实现了ETL作业的分布式执行,提高了ETL效率,为大数据环境下的基础数据加工提供了解决方案.
推荐文章
大数据环境下Hadoop分布式系统的研究与设计
大数据
高并发
高存储
高扩展性和可用性
Hadoop分布式的海量图像检索
Hadoop分布式
海量图像
SURF特征
K?Means聚类
检索
数据挖掘
基于GPRS的分布式销售系统研究
分布式
销售
终端
ARM
GPRS
μC/OSⅡ
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Hadoop的分布式ETL系统研究
来源期刊 广西通信技术 学科 工学
关键词 ETL Hadoop 大数据
年,卷(期) 2014,(4) 所属期刊栏目 专论综述
研究方向 页码范围 17-20
页数 4页 分类号 TN915.07
字数 2288字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 罗鹏 10 5 1.0 1.0
2 梁宏谦 4 4 1.0 1.0
3 梁耿 13 17 2.0 3.0
4 袁兵 4 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
ETL
Hadoop
大数据
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
广西通信技术
季刊
1008-3545
45-1225/TN
16开
南宁市新民路53号广西通信管理局
1981
chi
出版文献量(篇)
1047
总下载数(次)
5
论文1v1指导