【事故档案】
时间:2008年3月19日
地点:美国
起因:火灾
损失:数据中心遭毁,历时十天才得以修复。
2008年3月19日,美国威斯康辛数据中心被火烧得一塌糊涂。根据事后统计,这次大火已经烧掉了75台服务器、路由器和交换机,当地大量的站点都瘫痪。该数据中心属于当地一家“Camera Corner/Connecting Point”的公司所有,该公司主营网站托管和其他IT服务。

火烧威斯康辛数据中心
这次事故,给当地网站带来了巨大损失。耗时10天的修缮和重新部署,才使得这些网站得以上线。该公司CEO Rick Chernick也一再强调,公司为该数据中心投放了火灾险,而且数据中心的警报装置减轻了火灾带来的进一步损害。
然而,该数据中心耗时十天才得以完全恢复过来,足以说明该数据中心在当时并没有完备的备份计划。
同样还遭遇火灾影响的数据中心,有来自莫斯科的ISP服务器机房。根据监控画面我们知道,该数据中心起火原因是墙壁上的电闸开关短路而导致的。工作人员利用手中的各种工具将涌向服务器的烟雾和火花进行扑灭。然而值得称赞的是,尽管如此,该机房并没有中断电力。因为他们部署了UPS系统,这一点对于其他数据中心的设计和建筑来说都极具参考意义。
2009年7月,位于西雅图的Fisher Plaza数据中心的变压器起火引发火灾。此次火灾影响甚大,造成了包括微软Bing Travel、Authorize.net、Redfin、Big Fish Games、Survey Analytics等网站服务器的中断运行。这次事故在同一时间段引发了很多其他数据中心的宕机。
从此次灾难中,我们应该学会在选择数据中心服务商的时候,应该了解事故发生后网站需要多长时间从宕机中恢复过来。如果答案在几天甚至几周,那么可以考虑选择其他更值得信赖的服务商。
另外,我们也特别需要有完整灾备计划的事后措施,在数据中心场地和周边,务必有科学合理的消防设备和设计方案,数据中心的各个角落应该有尽可能多的消防器材。(在不影响通行和通风散热的情况下)











