随着软件定义联网(Software Defined Networking,SDN)的不断发展,SDN网络的需求和服务不断扩大.SDN控制器作为全网的控制和管理中心,承受着巨大的业务需求压力,极易造成SDN控制器的瘫痪和故障,出现服务中断等不利影响.同时,单个管理域所呈现的局限性也越来越大.为了解决SDN控制器瘫痪和故障造成的严重后果,克服单个管理域的局限性,在多管理域场景下,根据监测到的SDN控制器故障结果提出具体可行的控制器故障恢复的解决方案.为此,提出了基于OpenFlow消息进行SDN控制器故障监测的方法,研究了控制平面的多控制器部署问题,讨论了多控制器的同步机制,搭建主备控制器模型用于实现交换机迁移,根据域内和域间不同的应用场景,采用了不同的故障恢复策略.采用交换机迁移的最小代价原则选取备用控制器,实现故障恢复.测试结果表明,多管理域场景下对故障控制器执行不同的故障恢复策略可以实现对SDN控制器的故障恢复.