1. SPIDER'S WEB
  2. Social media
  3. Tech
  4. Technologie

Facebook nie działa. Jest trop, co się stało i jak wygląda naprawa awarii

Facebook nie działa. Jest trop, co się stało i jak wygląda naprawa awarii

Wszystkie usługi Facebooka przestały dziś niespodziewanie działać. Nie działa Facebook, WhatsApp, Instagram oraz logowanie przez usługę Facebook. Co ta awaria może oznaczać od strony technicznej?

Wygląda na to, że Facebook ma w tej chwili usunięte wszystkie wpisy w DNS.

Czytaj także:

Co to jest DNS?

DNS to "drogowskaz internetu". Jest to usługa zastępująca nazwy domenowe, których używamy i które są czytelne dla ludzi (np. Facebook.com, spidersweb.pl czy YouTube.com i zamienia na adresy IP, które są używane przez komputery, routery i inne urządzenia sieciowe. Brak wpisu w DNS powoduje, że żaden komputer nie jest w stanie rozwiązać nazwy domenowej i uzyskać "prawdziwego" adresu IP.

Jak to sprawdzić?

Istnieją usługi umożliwiające sprawdzenie wpisów DNS każdej strony. Każdy z nas ma je na komputerze - usługi typu dnslookup lub traceroute są częścią każdego systemu operacyjnego. Jednak istnieją także usługi webowe, które pomogą nam przeszukać adres DNS. Dla przykładu, wejście pod adres https://www.nslookup.io/dns-records/facebook.com pokazuje teraz następujący obrazek:

Facebook nie działa

Podobnie, uruchomienie na komputerze polecenia traceroute facebook.com (pod windows tracert ) pokazuje:

traceroute: unknown host facebook.com

Dla porównania wynik działania traceroute spidersweb.pl pokazuje poprawną ścieżkę, jaką musi przejść nasze zapytanie przez różne sieci - od naszej lokalnej do serwera.

Co mogło być przyczyną awarii?

Prawdopodobnie przyczyną awarii była błędna aktualizacji DNS lub ścieżek tzw. routingu (trasowania) systemu zwanego BGP (Border Gateway Protocol). Jest to, w dużym uproszczeniu, protokół internetowy, będący jedną z podstaw komunikacji w internecie. Pozwala na komunikację pomiędzy dużymi systemami autonomicznymi i używany jest przez firmy, których sieci posiadają dużo podsystemów i podsieci.

Jak zaobserwował John Graham-Cumming na Twitterze, reguły tego protokołu zanotowały bardzo dużo zmian (głównie usunięć) tuż przed awarią. Prawdopodobnie błędna aktualizacja tych wpisów "odcięła" serwery Facebooka od reszty świata:

Na Twitterze pojawiają kolejne informacje o możliwych przyczynach awarii.

Ktoś usunął duże sekcje routingu… To nie oznacza, że Facebook nie działa… Oznacza, że Facebook ZNIKNĄŁ.

Co robią inżynierowie w Facebooku aby odzyskać działanie aplikacji?

Jest bardzo prawdopodobne, że systemy Facebooka są w tej chwili odtwarzane z backupów (kopii bezpieczeństwa). Wskazuje to fakt, że niektórzy użytkownicy zaczynają widzieć np. bardzo stare wiadomości na WhatsApp. Aktualizacja niektórych serwerów wymaga dostępu fizycznego a... wejścia do nich bronią drzwi, które wymagają połączenia z serwerami Facebooka...

No cóż, wyobrażam sobie tą sesję typu lessons learned w której będą uczestniczyć specjaliści od infrastruktury firmy w najbliższych dniach.