针对复杂网络和多样化业务对故障管理提出的高要求,首先总结了运维发展历程,从人工运维、半自动化运维、自动化运维和智能化运维(Artificial Intelligence for IT Operations)几个阶段,阐述了智能运维的核心和关键点,对比了国内外标准化组织的运维发展特色和贡献;在此基础上梳理分析了网络故障方面的标准化组织对故障管理研究的特色和贡献,最后,进行了故障数据采集提取方式分类,故障定义分类研究.
随着网络规模扩大、复杂性增高、业务多样化,对网络运维管理的要求越来越高,而故障管理是运维管理中非常重要的功能之一,如何在故障发生时,快速准确定位迅速解决故障恢复正常一直是运维管理追求的目标,同时大数据人工智能技术的发展,对运维管理的智能性也提出了更高的要求,尤其对告警管理提出了前瞻性预测的需求,因此研究故障诊断技术是一项非常有意义的工作.