Вечером 4 октября мировой интернет содрогнулся от “падения” Facebook и смежных ему сервисов: Instagram, WhatsApp и Messenger. По итогу это “затишье” стало одним из самых длительных в истории сервисов и продлилось около 6 часов. Разбираемся, почему произошло “падение” и к чему оно привело.

Утром 5 октября представители Facebook выпустили официальное объяснение произошедшего: "Конфигурационные изменения в магистральных маршрутизаторах, которые отвечают за координацию сетевого трафика между нашими центрами обработки данных, привели к проблемам, которые прервали связь. Этот сбой в сетевом трафике оказал каскадное воздействие на способ связи наших центров обработки данных, что привело к тому, что наши службы перестали работать".

Чтобы объяснить это на “человеческом” языке, обратимся к статье на CloudFlare, аналитике от телеграм канала addmeto и знаниям автора материала.

Итак, начнем по порядку. 4 октября примерно в 19:00 (здесь и далее по минскому времени) Facebook, Instagram, WhatsApp, Messenger, все мобильные приложения и корпоративные и бизнес-сервисы компании перестали корректно загружаться, а вскоре и вовсе “пропали” из сети. Сбой продолжался до 01:00 5 октября и вызвал колоссальные проблемы для всего интернета.

Самой вероятной версией произошедшего является то, что один из сетевых администраторов компании внес некорректные изменения в конфигурацию Facebook. Это привело к тому, что большая часть социальной сети и смежных сервисов перестали существовать.

И на этом моменте важно разобраться с тем, как устроен интернет. По своей структуре это не одна глобальная сеть, а множество мелких сетей, которые собираются в бóльшие сети, те в еще бóльшие и так далее. Для обмена информацией между ними была создана особая система, которая позволяет сообщать данные о конфигурации и расположении сетей. Это происходит через маршрутизаторы по протоколу BGP (Border Gateway Protocol). Снизу приводим картинку, которая должна внести больше ясности в вышеописанное.

f1.png

Так вот, произошло следующее: одна из сетей сообщила всем другим сетям, что часть Facebook больше у нее не находится. По неудачному стечению обстоятельств случилось так, что в этой сети находились сервера, которые отвечали за домены, принадлежащие компании. Это привело к тому, что любой, кто пытался попасть на facebook.com, получал “пустой” ответ. Итог закономерен: все сервисы компании Facebook больше не работают ни для широкого круга пользователей, ни для работников компании.

При этом сложности для компании на этом не заканчивались: возникшую ошибку еще предстояло решить. И этот этап оказался невероятно сложным.

Во-первых, недоступными оказались все внутренние средства коммуникации. Из-за этого работникам пришлось срочно искать новую площадку для общения. К слову, таковой выступил Telegram.

Во-вторых, пропала возможность попасть в офисы компании. Все из-за того, что вход осуществлялся по бейджам, которые привязаны к интернет-авторизации. А Facebook со всей своей инфраструктурой “выпал” из глобальной сети.

В-третьих, часть возникшей проблемы можно было решить только путем физического взаимодействия с серверами, а это сложно осуществимо из-за удаленного формата работы большинства сотрудников.

Первые признаки жизни Facebook и вся его инфраструктура подали в 01:00 5 октября, а полностью “ожили” к 01:30.
При этом важно отметить, что выключение Facebook и всех его сервисов привело к мощнейшему удару по всему интернету. Люди, которые не смогли получить доступ к Instagram, WhatsApp или Messenger пошли искать альтернативу в других социальных сетях и мессенджерах. В основном это были Twitter и Telegram, которые в самом начале радовались резко подскочившему трафику, а после начали сами “умирать” под неожиданно массированной нагрузкой. Кстати, Павел Дуров последовал мировому мем-флешмобу и разместил в своем официальном канале вот такой опрос:

f2.png

Также “падение” Facebook привело к проблемам на многих сайтах, которые поддерживали авторизацию через социальную сеть. Из-за этого такие сайты столкнулись с безостановочным потоком запросов на авторизацию, которая не могла осуществиться. Итог: “легли” многие сайты по всему миру.

Проблемы затронули и многие мобильные приложения. Так, трафик некоторых подскочил в 30-50 раз. Все из-за притока людей, которые искали, чем заняться вечером.

На фоне произошедшего сбоя акции социальной сети резко обвалились на 5%.

f3.PNG

Основатель компании Марк Цукерберг потерял почти $7 млрд.