“摊上事了”曾是一句网络流行语,而近两天互联网有两个企业真的“出事”,5月27日下午5点开始的支付宝故障,是因为光缆被挖掘机挖断造成手机和电脑支付宝无法登陆、余额错误等问题。仅仅一天时间,携程网和App在28日完全登陆不上去,网上传出携程全线酒店数据库物理删除的消息,携程官方也发布声明称,遭到不明攻击,网站和App陷入瘫痪无法正常使用。而两件事一前一后的发生,引发整个行业的关注,背后更多是对数据安全和保护的讨论。
随着云计算和大数据的逐步普及,人们在互联网应用方面的资产托付越来越重。支付宝的宕机和携程数据的安全提醒用户,风险无处不在。由于两个事件已经深入到日常用户的资金和信息使用上,“出事”后传播之快,影响之大,使得业界再一次引发对于数据安全和数据中心容灾备份的关注。
5月27日下午17时左右,许多网友反映支付宝故障,在登陆手机支付宝钱包时,页面显示请求超时“请稍后在试”、余额宝等其他多款产品均无法使用。
5月27日18时,支付宝通过微博发布消息,承认支付宝使用出现故障,原因是杭州市萧山区某地光缆被挖断,支付宝官方说明不会对用户的资金安全有任何影响。
到晚上19时20分,支付宝宣布用户服务已经恢复正常,全程历时2个多小时。虽然事件逐渐平息,但支付宝又一次被推到风口浪尖,一根光纤就导致如此大面积的“崩溃”,可见支付宝的容灾备份和恢复机制还有待提升。
相比支付宝,携程旅行网官方网站28日突然陷入瘫痪,打开主页后显示“Service Unavailable”,而携程官方页面也显示404错误。对于此次官网瘫痪的原因。携程官方回应称,“5月28日上午11:09,因携程部分服务器遭到不明攻击,导致官方网站及APP暂时无法正常使用,目前正在紧急恢复,对用户造成的不便,深表歉意。”
事件的背后据了解,支付宝在系统上采用了“异地双活”架构,即杭州和外地两处机房同时为用户提供服务,系统会自动将全国所有用户的需求分流到两处机房。而在光纤被挖断的意外发生后,支付宝立即将用户发往杭州机房的需求引流至异地的机房,所以在受损光纤并未接通的情况下,支付宝服务已经可以恢复正常。但业内人士强调,针对金融业务来说,2小时的恢复时间可以算是一次重大事故。
究其原因,笔者并不想过多的谈论观点,或是列举网友一些所谓的“玩笑”,从事件本身展开,更多是让其他的用户和企业去不断完善相关IT建设和数据安全保障重要性,由此展开针对数据中心容灾备份的一些注意和经验的提供。