基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
LARGE框架是部署在中国科学院超级计算环境中的日志分析系统,通过日志收集、集中分析、结果反馈等步骤对环境中的各种日志文件进行监控和分析.在对环境中系统日志的监控过程中,系统维护人员需要通过日志模式提炼算法将大量的过往系统日志记录缩减为少量的日志模式集合.然而随着日志规模的增长以及messages日志文件的特殊性,原有的日志模式提炼算法已经难以满足对大规模日志快速处理的需要.介绍了一种对于日志模式提炼算法的优化方法,通过引入MapReduce机制实现在存在多个日志输入文件的情况下对日志处理和模式提炼的流程进行加速.实验表明,当输入文件较多时,该优化方法能够显著提高词汇一致率算法的运行速度,大幅减少运行时间.此外,还对使用词汇转换函数时的算法运行时间和提炼效果进行了验证.
推荐文章
基于组成设计模式的日志系统
日志系统
设计模式
组成模式
XML
基于大规模中文搜索引擎的搜索日志挖掘
搜索引擎
数据挖掘
搜索日志
分词
改进的事件日志分簇算法研究
事件日志
分簇算法
摘要向量
行模式
基于网页日志的频繁模式挖掘
模式挖掘
序列挖掘
图形挖掘
网页日志挖掘
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 对于大规模系统日志的日志模式提炼算法的优化
来源期刊 计算机工程与科学 学科 工学
关键词 日志处理 MapReduce机制 大数据分析 网格环境
年,卷(期) 2017,(5) 所属期刊栏目 高性能计算
研究方向 页码范围 821-828
页数 8页 分类号 TP393.027
字数 8240字 语种 中文
DOI 10.3969/j.issn.1007-130X.2017.05.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 赵一宁 中国科学院计算机网络信息中心 10 12 2.0 3.0
2 肖海力 中国科学院计算机网络信息中心 30 116 6.0 9.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (9)
共引文献  (17)
参考文献  (6)
节点文献
引证文献  (4)
同被引文献  (15)
二级引证文献  (19)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(5)
  • 参考文献(1)
  • 二级参考文献(4)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(6)
  • 引证文献(3)
  • 二级引证文献(3)
2019(12)
  • 引证文献(1)
  • 二级引证文献(11)
2020(5)
  • 引证文献(0)
  • 二级引证文献(5)
研究主题发展历程
节点文献
日志处理
MapReduce机制
大数据分析
网格环境
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导