基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目的:研究使用基于Flume的流式数据分层采集技术,以提高数据采集的可靠性与有效性,为流计算引擎提供稳定的数据流.方法:使用基于Flume的流式数据分层采集模型,并在此基础上提出分层采集进程监控方法和基于分组的双层哈希负载均衡方法.结果:从数据迁移率、吞吐量、节点平均耗时三个指标进行评价,实验结果表明,运用基于分组的双层哈希负载均衡方法能有效地均衡节点间的负载,提高数据采集效率.结论:分布式环境下,运用基于Flume的流式数据分层采集模型,所提的分层采集进程监控方法和双层哈希负载均衡方法可有效提高数据采集的稳定性与可靠性,因而可为流计算引擎提供实时、稳定的数据流.
推荐文章
分布式无线地震数据采集同步技术研究
分布式地震数据采集
GPS时钟授时
压控晶振
采集同步
精确时间戳
一种动态分层分布式数据采集算法
动态分层分布式
移动agent
域拓扑次序
数据采集
基于Nutch的分布式电商数据采集技术研究
电商数据
反爬
Nutch
分布式
采集
分布式大数据采集关键技术研究与实现
大数据
数据采集
正文提取
IP代理池
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向分布式环境的分层数据采集技术研究
来源期刊 中国计量大学学报 学科
关键词 Flume架构 数据采集 数据流 负载均衡
年,卷(期) 2021,(1) 所属期刊栏目 信息科学|Information Science
研究方向 页码范围 74-82
页数 9页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.2096-2835.2021.01.011
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (271)
共引文献  (845)
参考文献  (19)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1936(1)
  • 参考文献(0)
  • 二级参考文献(1)
1971(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1982(3)
  • 参考文献(0)
  • 二级参考文献(3)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(4)
  • 参考文献(0)
  • 二级参考文献(4)
2002(6)
  • 参考文献(0)
  • 二级参考文献(6)
2003(6)
  • 参考文献(0)
  • 二级参考文献(6)
2004(7)
  • 参考文献(0)
  • 二级参考文献(7)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(7)
  • 参考文献(0)
  • 二级参考文献(7)
2007(14)
  • 参考文献(0)
  • 二级参考文献(14)
2008(12)
  • 参考文献(0)
  • 二级参考文献(12)
2009(8)
  • 参考文献(0)
  • 二级参考文献(8)
2010(20)
  • 参考文献(1)
  • 二级参考文献(19)
2011(22)
  • 参考文献(0)
  • 二级参考文献(22)
2012(29)
  • 参考文献(0)
  • 二级参考文献(29)
2013(34)
  • 参考文献(1)
  • 二级参考文献(33)
2014(40)
  • 参考文献(3)
  • 二级参考文献(37)
2015(26)
  • 参考文献(3)
  • 二级参考文献(23)
2016(16)
  • 参考文献(4)
  • 二级参考文献(12)
2017(8)
  • 参考文献(3)
  • 二级参考文献(5)
2018(6)
  • 参考文献(2)
  • 二级参考文献(4)
2019(2)
  • 参考文献(1)
  • 二级参考文献(1)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Flume架构
数据采集
数据流
负载均衡
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国计量大学学报
季刊
2096-2835
33-1401/C
大16开
杭州市下沙高教园
1990
chi
出版文献量(篇)
1770
总下载数(次)
1
总被引数(次)
9715
论文1v1指导