基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
研究了大规模超级计算机群系统的失效预测.针对现有的单一分析系统日志的方法不仅需要复杂的分布式数据挖掘技术,而且失效预测的召回率普遍不高的问题,提出了一种通过将记载集群系统负载变化的作业日志同系统日志结合起来分析来进行失效预测的方法.该方法的原理如下:首先,通过对原始系统日志和作业日志进行预处理和过滤,分别得到细粒度的二维的事件序列和作业序列;然后从中抽取出在系统日志的失效事件发生前作业日志所表现出的三种典型失效征兆;最后,利用失效征兆进行失效预测.在真实的IBM BlueGene/P系统的系统日志和作业日志上的实验结果表明,基于两种日志结合分析的方法能以较高的准确率和召回率实现细粒度的失效预测.
推荐文章
共模失效情况下集群系统可用性分析
集群
共模失效
可用性
马尔科夫过程
模型
验证
一种基于cookie会话保持的LVS集群系统
Linux虚拟服务器
集群
会话保持
cookie
源IP
基于并行模拟的多核集群系统性能预测和分析
多核集群
消息传递
并行模拟
性能预测
一种基于cookie会话保持的LVS集群系统
Linux虚拟服务器
集群
会话保持
cookie
源IP
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于日志结合分析的集群系统失效预测方法
来源期刊 高技术通讯 学科
关键词 大规模集群系统 系统日志 作业日志 日志分析 失效预测
年,卷(期) 2016,(6) 所属期刊栏目 计算机与通信
研究方向 页码范围 519-527
页数 9页 分类号
字数 7122字 语种 中文
DOI 10.3772/j.issn.1002-0470.2016.06.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 孙凝晖 69 478 12.0 19.0
3 詹剑锋 29 388 10.0 19.0
5 付晓毓 1 3 1.0 1.0
14 任睿 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (3)
同被引文献  (1)
二级引证文献  (7)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(2)
  • 引证文献(1)
  • 二级引证文献(1)
2019(3)
  • 引证文献(0)
  • 二级引证文献(3)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
大规模集群系统
系统日志
作业日志
日志分析
失效预测
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
高技术通讯
月刊
1002-0470
11-2770/N
大16开
北京市三里河路54号
82-516
1991
chi
出版文献量(篇)
5099
总下载数(次)
14
总被引数(次)
39217
论文1v1指导