基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
当今网络带宽、设备和应用数量急剧扩张,日志管理面临数据量爆炸式增长的挑战。基于SQL-on-Hadoop构建网络日志分析平台,实现千亿级日志存储和高效、灵活查询。利用真实TB 级数据集对多种 Hadoop 列存储格式及压缩算法进行性能测试,并对比Hive和Impala引擎日志扫描及统计查询效率,选用Gzip压缩的Parquet格式可将日志体积压缩80%,且将Impala查询性能提升至5倍。基于该平台已开发6种安全事件响应、攻击检测和预警应用并发挥良好效果。
推荐文章
基于Hadoop的网络日志挖掘方案的设计
网络日志
数据挖掘
数据清洗
Hadoop
MySQL
基于SQL-on-Hadoop查询引擎的日志挖掘及其应用
大数据
日志分析
数据挖掘
Hadoop
查询引擎
数据采集
索引存储
证券行业
基于PATRICIA算法的动态网络日志分析
网络管理
网络管理系统
PATRICIA算法
基于大数据技术的网络日志分析系统研究
大数据
日志采集
MapReduce
日志分析
IP统计
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于SQL-on-Hadoop的网络日志分析
来源期刊 通信学报 学科 工学
关键词 日志分析 大数据 Hadoop SQL 网络安全
年,卷(期) 2014,(z1) 所属期刊栏目 网络空间安全
研究方向 页码范围 14-19
页数 6页 分类号 TP393.08
字数 4965字 语种 中文
DOI 10.3969/j.issn.1000-436x.2014.z1.004
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 姜开达 上海交通大学网络信息中心 43 116 6.0 8.0
2 章思宇 上海交通大学网络信息中心 15 67 4.0 7.0
3 罗萱 上海交通大学网络信息中心 19 87 6.0 8.0
4 王海洋 上海交通大学电子信息与电气工程学院 6 16 3.0 4.0
5 韦建文 上海交通大学网络信息中心 13 41 3.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (1)
参考文献  (2)
节点文献
引证文献  (3)
同被引文献  (2)
二级引证文献  (21)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(3)
  • 引证文献(1)
  • 二级引证文献(2)
2017(5)
  • 引证文献(1)
  • 二级引证文献(4)
2018(5)
  • 引证文献(0)
  • 二级引证文献(5)
2019(9)
  • 引证文献(0)
  • 二级引证文献(9)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
日志分析
大数据
Hadoop
SQL
网络安全
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
通信学报
月刊
1000-436X
11-2102/TN
大16开
北京市丰台区成寿路11号邮电出版大厦8层
2-676
1980
chi
出版文献量(篇)
6235
总下载数(次)
17
总被引数(次)
85479
论文1v1指导