基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
日志数据记录着丰富的信息, 具有较高的实用价值, 但在当今大数据时代环境下, 数据量的陡增为日志数据的处理带来了挑战. 为了有效地解决海量日志数据处理面临的瓶颈问题, 本文整合Hadoop和Storm分布式框架, 构建一种融合了实时计算与离线计算的分布式日志实时处理系统. 系统架构由数据服务层、 业务逻辑层和Web展示层组成, 数据服务层使用Flume实时采集日志数据, 并分别采用Kafka与HBase完成实时日志流数据的缓冲和系统数据的持久化存储;业务逻辑层利用Storm对实时日志流数据进行实时分析, 并使用Hadoop的计算引擎MapReduce结合数据挖掘技术完成对海量历史日志数据的离线分析, 离线分析的结果为实时分析提供支持、 参考;Web展示层负责日志数据及其分析结果的展示. 实验结果表明, 系统能有效地解决日志数据的采集存储、 实时日志流数据的实时分析和历史日志数据的离线分析等问题, 并成功地融合了Hadoop与Storm各自的优势, 为日志数据的采集和分析系统的构建提供新的技术参考.
推荐文章
基于Spark Streaming的海量日志实时处理系统的设计
大数据
SparkStreaming
日志分析
分布式计算
实时流处理系统Storm的调度优化综述
流式数据处理
Apache Storm
性能优化
调度
基于RTX的实时处理系统设计
Windows实时扩展
PCI实时驱动
DMA
进程间通信
基于DSP人工混响算法实时处理系统
DSP
实时处理
人工混响
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Hadoop与Storm的日志实时处理系统研究
来源期刊 西南师范大学学报(自然科学版) 学科 工学
关键词 日志 Hadoop Flume Storm HBase
年,卷(期) 2017,(4) 所属期刊栏目 应用研究
研究方向 页码范围 119-126
页数 8页 分类号 TP399
字数 4470字 语种 中文
DOI 10.13718/j.cnki.xsxb.2017.04.019
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吕家恪 西南大学计算机与信息科学学院 26 347 13.0 18.0
3 李洋 西南大学计算机与信息科学学院 27 96 6.0 9.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (27)
共引文献  (108)
参考文献  (9)
节点文献
引证文献  (15)
同被引文献  (41)
二级引证文献  (4)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(5)
  • 参考文献(2)
  • 二级参考文献(3)
2012(9)
  • 参考文献(2)
  • 二级参考文献(7)
2013(3)
  • 参考文献(1)
  • 二级参考文献(2)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(8)
  • 引证文献(8)
  • 二级引证文献(0)
2019(7)
  • 引证文献(4)
  • 二级引证文献(3)
2020(3)
  • 引证文献(2)
  • 二级引证文献(1)
研究主题发展历程
节点文献
日志
Hadoop
Flume
Storm
HBase
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西南师范大学学报(自然科学版)
月刊
1000-5471
50-1045/N
大6开
重庆市北碚区天生路2号
78-22
1957
chi
出版文献量(篇)
6658
总下载数(次)
10
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导