昨日AWS再宕机,到底谁的锅?为何如此频繁?

昨晚,全球公有云一哥AWS发生了本月第二次宕机。

据彭博报道,亚马逊旗下AWS证实,由于一家外部服务提供商出现问题,影响了部分客户网络和多个AWS区域之间的互联网连接。今日稍早些时候,追踪网站故障的Downdetector.com网站称,从美国东部时间早上8点32分(北京时间晚上8点32分),亚马逊AWS云服务出现宕机。

不过,亚马逊回应时强调,是外部服务商出了问题。"由其他外部服务提供商提供的服务,与所在AWS区域内的连接不受影响。"

一个月内第二次宕机

6月2日凌晨AWS宕机导致北方区大面积网络瘫痪,包括VIPKID、流利说、三星应用商店等多个用户都均受到不同程度的影响,就连亚马逊中国官网的页面也一度崩溃。

关于事故原因,AWS在官方声明中却称故障的原因是CN-NORTH-1地区的隔夜道路施工中有几处光缆被切断,导致可用区无法链接网络,进而引发所有可用区中新的实例无法启动的故障。

对于这次故障的原因,有业内人士认为完全可以避免,认为此次AWS光缆被切断导致近12小时大面积服务瘫痪正是因为没有做好网络冗余设计。

据了解,云服务商提供都会备用两条冗余,能够实现跨数据中心自动复制存储对象与文件,保障数据中心内业务系统的可用性。备用的两条冗余,完全挡得住挖掘机的一铲子。

如果说外部服务商和挖掘机可以成为AWS宕机的背锅侠,那么按照这个逻辑,雷电风暴都要为AWS宕机背锅。

根据不完全统计,AWS2010 就出现不少于四次因停电、雷电、交通事故等出现故障;2016年AWS在悉尼的设施因风暴宕机,从银行到外卖都出现了问题;2018年3月,AWS因其位于弗吉尼亚数据中心遇到了东北风暴的冲击,而使得网络连接出现了问题……

当然,所有的公有云供应商在发展中都会面临各种各样的问题,就像网友说的,"如果每一次宕机都归咎于暴风雨和挖掘机,那就是AWS自己的问题了。"

AWS从2018年到2019年的故障整理

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();