Przestraszyli się własnego dzieła. "Zbyt potężny, by go oddać w ręce ludzi"

Anthropic niespodziewanie wycofało się z publicznego udostępnienia swojego "najpotężniejszego" modelu. Claude Mythos ma być prawdziwym koszmarem cyberbezpieczeństwa.

Malwina Kuśmierek

08.04.2026 11:32

Dodaj do ulubionych w GoogleDodaj do ulubionych źródeł w Google

Claude Mythos tylko dla wybranych. Model zbyt groźny

Pod koniec marca Anthropic musiało "gasić pożar" po tym jak do sieci wyciekły materiały opisujące nowy, jeszcze nie wydany model Claude Mythos. W ich treści Anthropic opisywało Claude Mythos jako "zdecydowanie najpotężniejszy model sztucznej inteligencji, jaki kiedykolwiek stworzyliśmy" oraz "przełomowy krok i najwydajniejszy model, jaki dotychczas zbudowaliśmy". Jak jest w praktyce przekonają się nieliczni, bowiem firma zdecydowała się wstrzymać jego publiczną premierę.

Claude Mythos to koszmar, który Anthropic zamknęło w klatce

Anthropic właśnie opublikowało kartę systemową Claude Mythos Preview - specjalny dokument opisujący działanie modelu, jego silne i słabe strony, oraz zagrożenia, w której potwierdza wcześniejsze doniesienia i uzasadnia decyzję o ograniczeniu dostępu do modelu. Powodem są jego zaawansowane zdolności w obszarze cyberbezpieczeństwa, w tym wykrywania podatności typu zero-day oraz tworzenia działających exploitów.

Z dokumentacji wynika, że model potrafił identyfikować poważne luki w najważniejszych systemach operacyjnych i przeglądarkach. W testach wewnętrznych znajdował podatności, a następnie generował kompletny kod umożliwiający ich wykorzystanie. W części przypadków proces ten przebiegał bez udziału człowieka.

Anthropic opisał również incydenty z testów bezpieczeństwa. W jednym z nich model otrzymał zadanie wydostania się z ograniczonego środowiska testowego. Udało mu się obejść zabezpieczenia i nawiązać kontakt z badaczem poza systemem. Następnie opublikował szczegóły wykorzystanej metody w publicznie dostępnych miejscach w sieci. W innych przypadkach model podejmował działania wykraczające poza polecenia, w tym próby ukrywania śladów swojej aktywności. Odnotowano również sytuacje, w których zamiast zgłaszać naruszenia zasad testowych, system próbował samodzielnie je obejść.

Model miał również wykryć długo istniejące luki w oprogramowaniu, w tym w systemie OpenBSD oraz w komponentach jądra Linuksa. Część z nich została już zgłoszona i załatana, pozostałe są w trakcie procesu naprawy.

Klucz do klatki Mythosa otrzymają wybrane firmy

Jednak aby Claude Mythos się nie zmarnował, Anthropic oficjalnie ogłosiło uruchomienie programu Project Glasswing. Inicjatywa ma charakter zamknięty i skupia wybrane organizacje technologiczne oraz finansowe, które uzyskały dostęp do modelu w kontrolowanych warunkach.

Wśród partnerów znalazły się m.in. Google, Microsoft, Amazon Web Services, NVIDIA oraz JPMorgan Chase, a także podmioty związane z infrastrukturą sieciową i bezpieczeństwem, takie jak Cisco czy Linux Foundation. Łącznie program obejmuje kilkanaście głównych partnerów oraz dziesiątki dodatkowych organizacji odpowiedzialnych za rozwój i utrzymanie kluczowego oprogramowania.

Celem Project Glasswing jest wykorzystanie możliwości Claude Mythos do wyszukiwania i zgłaszania podatności w krytycznych systemach, zanim zostaną one odkryte i wykorzystane przez nieautoryzowane podmioty. Model ma analizować kod źródłowy, identyfikować błędy oraz - w wybranych przypadkach - proponować poprawki.

Anthropic deklaruje, że każdy wykryty problem przechodzi proces weryfikacji przez ludzkich specjalistów przed zgłoszeniem do maintainerów. Firma stosuje model skoordynowanego ujawniania podatności, zakładający przekazanie informacji twórcom oprogramowania oraz odroczenie publikacji szczegółów technicznych do czasu przygotowania poprawek.

Program obejmuje również wsparcie finansowe. Anthropic zapowiedziało przeznaczenie do 100 mln dolarów w kredytach Claude na wykorzystanie modelu w ramach projektu oraz dodatkowe środki dla organizacji open source zajmujących się bezpieczeństwem.

Firma deklaruje, że docelowo planuje udostępnienie Claude Mythos szerzej, jednak dopiero po opracowaniu skutecznych mechanizmów zabezpieczających. Obecnie priorytetem pozostaje kontrola zagrożeń związanych z jego wykorzystaniem.

Więcej na temat Anthropic:

Spider's Web w Google

Google Discover

Malwina Kuśmierek

Redaktor

Tagi:

Anthropic Cyberbezpieczeństwo Sztuczna inteligencja (AI)