REKLAMA

Czapki z głów. Firefox pokazuje, jak się komunikować z użytkownikami, gdy się nawaliło

Mozilla potrafi wzbudzić zaufanie, nawet mówiąc o swoich błędach. Post Erica Rescorli z opowieścią o tym, jak jego zespół radził sobie z wielką awarią rozszerzeń, powinien przeczytać każdy menadżer komunikujący się z klientami.

Mozilla Firefoks niedziałające rozszerzenia
REKLAMA
REKLAMA

Jeśli jesteś użytkownikiem Firefoksa i korzystałeś w zeszły weekend z przeglądarki, zamiast przekładać karkówkę z boczku na boczek, prawdopodobnie zauważyłeś, że duża część twoich normalnych rozszerzeń nie działała. Wielkie awaria dotknęła niemal wszystkie rozszerzenia użytkowników. Eric Rescorla, CTO zespołu Firefoksa, w poście na blogu Mozilli szczegółowo opowiedział o tym, jak do tego doszło, jak firma zareagowała na kryzys i co zamierza zrobić, żeby już nigdy więcej się to nie powtórzyło.

Takie rzeczy zawsze psują się w piątek po południu.

Jak pisze CTO, obecnie dostępnych jest ponad 15 tys. rozszerzeń do Firefoksa. Żeby zapobiec przenikaniu na komputery podejrzanych i złośliwych programów, każde z nich jest sygnowane certyfikatem, który świadczy o tym, że przyjrzał się mu ktoś z zespołu Mozilli i uznał, że nie ma w nim nic podejrzanego. Problem w tym, że certyfikaty mają swoje terminy ważności. Jeden z tych używanych przez Mozillę wygasł 4 maja o 3 rano naszego czasu. O tym, że dzieje się coś niedobrego, zespół Firefoksa dowiedział się pod koniec długiego tygodnia pracy, gdy radośnie wybiegał z biura w piątek o 18.

Zespół zaczął od szeregu kroków, które miały sprawić, że sytuacja jeszcze bardziej nie wymknie się spod kontroli i dopiero potem zabrał się za rozwiązywanie źródła problemu. Pracownicy Mozilli brali pod uwagę kilka rozwiązań, a ponieważ nie byli pewni, które z nich zadziała najlepiej, zdecydował się na równoległą pracę nad dwoma, które najlepiej rokowały. Z jednej strony przygotowali patch do Firefoksa, który miał zmienić datę służącą do walidacji certyfikatu, z drugiej wygenerowali zastępczy certyfikat i przekonali przeglądarkę do zaakceptowania go w miejsce tego wygasłego. W ostateczności zdecydowano się na tę drugą opcję.

Wpadka. Naprawa. Jasny komunikat. Wnioski.

Zespół został w pracy dodatkowe 9 godzin, żeby wymyślić i zrealizować ten plan awaryjny. O 2:44 zaczęto wysyłać łatkę do użytkowników, a po 12 godzinach znalazła się ona już na większości komputerów.

REKLAMA

Rescorla opisuje nie tylko, co jego pracownicy robili w tym czasie, ale także, jakie opcje brali pod uwagę i na jakie przeszkody natrafili po drodze. Postmortem zostanie przeprowadzone dopiero w przyszłym tygodniu i, jak obiecuje CTO, wnioski z niego także zostaną zaprezentowane na blogu. Jednym z oczywistych jest sprawienie, żeby taka sytuacja nigdy więcej się nie powtórzyła.

Błędy się zdarzają każdemu i nie sposób ich wyeliminować. Dobrą firmą poznaje się po tym, jak sobie z nimi radzi i jak o nich mówi.

REKLAMA
Najnowsze
REKLAMA
REKLAMA
REKLAMA