Facebook遭遇有史以来最严重宕机事件,罪魁祸首与DNS故障有关?

Posted 中科三方

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Facebook遭遇有史以来最严重宕机事件,罪魁祸首与DNS故障有关?相关的知识,希望对你有一定的参考价值。

当地时间10月4日,Facebook 及其旗下 Instagram 和 WhatsApp 等应用全网宕机,停机时间近 7 小时 ,浏览器在尝试打开时显示 DNS 错误。

宕机期间,Facebook 在欧洲、美洲、大洋洲几乎完全下线,在亚洲的日本、韩国、印度等国也无法访问。除了让数十亿用户陷入困境之外, Facebook 服务中断还使得其员工无法使用内部工具相互交流。Facebook 首席技术官 Mike Schroepfer 只能通过推特向用户道歉。

这对于月活和日活高达 35.1 亿和 27.6 亿的 Facebook 而言,可谓损失惨重。据投资机构估计,7 小时宕机直接产生超过 9.68 亿美元的影响成本,并使 Facebook 市值损失 643 亿美元,其创始人马克·扎克伯格净资产蒸发 70 亿美元。

宕机故障原因

Facebook 表示,这次故障的根本原因是例行维护工作时发出的一条指令导致其 DNS 服务器不可使用,从而切断了 Facebook 整个骨干网络与数据中心之间的连接,这实质上就是断开了 Facebook 全球数据中心之间的连接。

由于 Facebook 的架构设计是根据服务器可用性来扩展或缩减 DNS 服务,当服务器可用性因网络故障而降至零时,就会停用所有 DNS 服务器。这种停用通过 Facebook 的 DNS 名称服务器向互联网边界网关协议(BGP) 路由器发送消息来完成的,这些路由器存储用来抵达特定 IP 地址的路由方面的信息。这些路由通常被公告给路由器,让路由器了解如何适当地引导流量。

在此次宕机事件中,由于整个骨干网都已陷入瘫痪,因此各 DNS 服务器位置均上报连接状态问题并撤回边界网关协议(BGP)通告。最终结果是,Facebook 的 DNS 服务器虽然仍在运行但却无法正常访问,导致其他互联网用户也无法正常接入其服务器。

在此过程中,我们可以看出DNS在其中扮演了很重要的角色,DNS的故障是导致Facebook宕机的主要原因。

什么是DNS?

DNS是Domain Name System的缩写,翻译成中文就是“域名系统”。DNS是互联网中的一项核心服务,是用于实现域名和IP地址相互映射的一个分布式数据库,它将简单明了的域名翻译成可由计算机识别的IP地址,使用户可以更快速便捷地访问互联。

简单来讲DNS就是翻译官,把baidu.com这样简单易记的域名翻译成220.181.111.188的IP地址让机器理解,从而实现域名和IP之间的相互转化。

由此可见,DNS是网络上一种非常重要和基础的功能,DNS故障会对整个网络的正常访问和运行造成严重影响,从此次Facebook宕机事件中就可见一斑。

除此之外,DNS系统也是网络攻击的重点对象,DNS劫持、DNS污染等针对DNS的攻击手段层出不穷,给各行各业都带来了严重危害。因此加强DNS安全防护能力,在网络攻击日趋频繁的今天已是刻不容缓。

云解析——DNS解析新趋势

中科三方DNS云解析系统,采用分布式云架构体系,在国内和海外各地部署多个解析服务节点,与传统解析技术相比,中科三方DNS云解析系统具备以下几点优势:

(1)采用分布式云架构体系,可有效分摊超大流量访问和恶意DDoS攻击,提升域名解析系统承载能力和系统容灾能力,保障域名系统的安全性和稳定性。

(2)支持智能解析和负载均衡,可根据访客地址和IP智能划分解析节点和线路,实现用户的就近选择和低延迟接入,有效提升域名解析和网站访问速度,保障用户的访问和使用体验。

(3)采用高防DNS集群技术,支持更高的DDoS攻击和QPS查询防护,全面提升网站域名的抗攻击和防劫持能力。

(4)分布式监测节点,实时监测网站域名状态,24小时轮询监测,发现异常情况及时作出响应,实现快速容灾切换,保障网站服务的连续性。

与传统单节点解析相比,云解析系统无论是在解析速度、解析稳定、安全防护等多方面均有了显著提升,可有效提升域名管理能力、解析能力、抗攻击/防劫持能力以及故障恢复能力,为广大政企客户的域名及网站安全保驾护航。

以上是关于Facebook遭遇有史以来最严重宕机事件,罪魁祸首与DNS故障有关?的主要内容,如果未能解决你的问题,请参考以下文章

Facebook史上最严重宕机,全网宕机近七小时,到底是怎么回事?

Facebook史上最严重宕机:互联网企业是时候重新审视架构了?

Facebook宕机事故,暴露了上云不是唯一的答案

美议员:Facebook 严重宕机凸显垄断风险,应该将其分拆

GitHub 多次宕机的罪魁祸首竟是 MySQL?

要凉?GitHub连续3天严重宕机;百度智能云一把手尹世明离职;董明珠开启直播带货首秀;Rust语言2019调查报告发布