基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
脸谱最佳实践:面对快速变化的系统可靠性. 故障已经成为任何大规模系统工程中的一部分.脸谱(Facebook)的价值观之一就是拥抱故障.门洛帕克市(Menlo Park)脸谱总部的墙上,悬挂着这样的海报:“假如没有恐惧,你会做什么?”和“天佑勇者”. 为了让脸谱在快速变化中保持系统的高可靠性,我们研究了通用的故障模式,并构建了用于处理故障的各种抽象.这使我们能够采取最好的措施确保在脸谱的整个基础设施中提高系统可靠性.为了指导我们抽象出可靠性概念,就必须理解大规模系统中的故障.为此我们构建了故障诊断工具和事故复审(incident review)机制,来推动我们不断改进系统,并预防未来的故障.
推荐文章
基于神经网络的大规模模拟电路故障检测系统
神经网络
小波变换
电路故障诊断
基于Petri网的大规模网络服务系统故障预测与演化
模糊Petri网
网络服务系统故障
正向矩阵预测
反向矩阵预测
超大规模火电设备故障检测系统的研发与实现
火电故障数据
冗余数据
支持向量机
云计算大规模服务器故障诊断平台的设计
云计算
大规模服务器
故障诊断
软件设计
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 大规模系统中的故障
来源期刊 中国计算机学会通讯 学科
关键词 大规模分布式系统 故障诊断 事故复审
年,卷(期) 2016,(1) 所属期刊栏目 译文
研究方向 页码范围 86-92
页数 7页 分类号
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
大规模分布式系统
故障诊断
事故复审
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国计算机学会通讯
月刊
N
北京2704信箱
chi
出版文献量(篇)
1118
总下载数(次)
6
论文1v1指导