数据中心业务中断原因分析及业务连续性解决方案
云计算、虚拟化技术广泛运用的今天,为业务进行和维护带来方便的同时,数据中心也面临各种风险。云祺根据全球业务中断事件,以及真实案例总结出,常见的导致数据中心业务中断的三大原因。 一 硬件故障 包括服务器/存储宕机、Raid系统停止工作、内存虚拟驱动器受损等原因。 某云服务商因硬件故障导致服务器不可用数据丢失,联系服务器提供商和多家专业数据恢复公司紧急恢复后,仍多次恢复失败,最后确认数据无法恢复。 随着硬件系统发展的成熟度,针对硬件冗余方案较完善,比如双机热备、存储双活、虚拟化方式等,因硬件故障发生业务中断的事件概率不断下降。 二 逻辑错误 逻辑错误又包括了软件原因和人为原因。软件原因有应用系统出现错误、文件系统崩溃、数据库逻辑故障、病毒等。人为原因有数据误删除、虚拟设备被删除、恶意操作等。 某银行电脑脱机致网络瘫痪,业务中断三小时;某公司被勒索病毒,巨额勒索金额下,不得不“牺牲”业务数据;某云服务商遭员工恶意删除数据库,影响百万用户,预计赔付1.5亿元... 逻辑错误是导致数据丢失、业务中断事件发生的重要原因。 三 自然灾害 比如发生灾害、地震、暴雨等意外与自然灾害。 亚马逊位于弗吉尼亚的US-East-1数据中心因为一场风暴导致业务瘫痪,由于数据中心停止运行,亚马逊的云服务Amazon Web Services也因此一度中断服务;某学校机房在一场连续暴雨中意外进水,数据中心直接被毁