作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统的ETL工具有集中执行、对服务器性能要求高等缺点,针对这些缺点,本文提出了一种基于Hadoop的分布式ETL系统。该系统在分布式文件系统基础上,利用相应的数据过滤器和Hadoop强大的并行处理能力,实现了集群分布式执行ETL流程。该分布式ETL系统具有较高的可扩展性和吞吐效率,同时能够自动实现负载均衡,执行效率高。
推荐文章
一种分布式编译系统的设计与实现
分布式编译
集群
MSBuild
一种协同的分布式本体管理系统设计与实现
本体管理系统
协同
分布式
非结构化信息
一种分布式磁盘缓存的设计与实现
分布式
内存密集型
磁盘缓存
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种分布式ETL工具的设计与实现
来源期刊 软件 学科 工学
关键词 ETL Hadoop 分布式
年,卷(期) 2013,(10) 所属期刊栏目 软件工程
研究方向 页码范围 73-77
页数 5页 分类号 TP311
字数 4189字 语种 中文
DOI 10.3969/j.issn.1003-6970.2013.10.027
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘豹 北京邮电大学网络技术研究院 1 15 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (8)
参考文献  (2)
节点文献
引证文献  (15)
同被引文献  (46)
二级引证文献  (40)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(2)
  • 引证文献(2)
  • 二级引证文献(0)
2015(7)
  • 引证文献(6)
  • 二级引证文献(1)
2016(17)
  • 引证文献(3)
  • 二级引证文献(14)
2017(8)
  • 引证文献(0)
  • 二级引证文献(8)
2018(10)
  • 引证文献(1)
  • 二级引证文献(9)
2019(9)
  • 引证文献(3)
  • 二级引证文献(6)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
ETL
Hadoop
分布式
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件
月刊
1003-6970
12-1151/TP
16开
北京市3108信箱
1979
chi
出版文献量(篇)
9374
总下载数(次)
40
论文1v1指导