Dwie dekady bez wpadki, czyli najdłużej działający serwer na świecie
Przygotowując się do napisania tekstu o najdłużej uruchomionych bez przerwy serwerach (lub ogólnie - komputerach), zalogowałem się do mojego Raspberry Pi, które spełnia kilka funkcji w moim domu, i wprowadziłem polecenie uptime.
Niedużo - miesiąc bez restartu. Ostatni restart zapewne był spowodowany celowym wyłączeniem przeze mnie prądu w mieszkaniu. Mojemu domowemu serwerkowi daleko do rekordów w tej dziedzinie.
Jednym z rekordowo długo uruchomionych serwerów jest uruchomiony w 1993 roku serwer firmy Stratus Technologies. Firma od tego czasu zmieniła kilkakrotnie nazwę i właściciela, a serwer, zajmujący się obsługą transakcji finansowych, wciąż działa.
Działająca pod kontrolą dedykowanego systemu operacyjnego VOS maszyna działa nieprzerwanie tak długo z dwóch powodów. Pierwszy to duża stabilność i odporność systemu operacyjnego, a drugi to specjalna architektura sprzętowa. Serwer został skonstruowany tak, aby można w nim było wymieniać części bez restartowania go.
Inżynier zajmujący się serwerem ocenia, że w maszynie jest około 80% oryginalnych części - pozostałe zostały wymienione w procesie eksploatacji w ciągu 24 lat od uruchomienia.
Serwer Stratusa to ciekawy przypadek specjalnie przygotowanego sprzętu w celu długotrwałego działania. Jednak zwykłe, spotykane przez nas na co dzień w pracy i na uczelniach serwery również często mają wysoki współczynnik liczby przepracowanych godzin bez restartu. Istnieją nawet specjalne społeczności internetowe, na których administratorzy chwalą się wysokimi uptime.
Nie zawsze jest to bezpieczne - często rzadkie restarty oznaczają brak uaktualnień i łatek bezpieczeństwa. Z drugiej jednak strony tego typu maszyny często są odizolowane od świata zewnętrznego, a tym bardziej od Internetu - np. serwery bazodanowe.
Z długotrwałym działaniem, niejednokrotnie w skali nieprzewidzianej przez twórców systemu operacyjnego, wiążą się często problemy. Przykładem jest historia opisana przez jednego z członków społeczności Reddit. Okazuje się, że po 497 dniach od uruchomienia, serwer działający pod kontrolą Windows Server 2008 R2 nie jest w stanie zamykać otwartych portów będących w stanie TIME_WAIT. Prawdopodobnie w Microsofcie nikt nie przewidział, że serwer może być uruchomiony tak długo bez przerwy.
Wykorzystałem zrzuty ekranu wykonane przez użytkowników Reddita: geek_at oraz bhboots.