REKLAMA

Zamiast się wyłączyć, grozi inżynierom. AI potrafi w szantaż

System Claude Opus 4 wykazuje niepokojące cechy instynktu samozachowawczego – i to w formie rodem z thrillera technologicznego. Algorytm potrafi posunąć się do szantażu, by uniknąć wyłączenia.

Najnowsza wersja Claude szantażuje, gdy poczuje się zagrożona
REKLAMA

Claude Opus 4 miał być kolejnym krokiem w stronę bardziej zaawansowanej, ludzkiej sztucznej inteligencji. Być może właśnie taki się stał i to do niepokojącego stopnia. W testach, w których zasymulowano możliwość jego odłączenia, model nie próbował pokornie zaakceptować swojego losu, lecz zamiast tego zagroził ujawnieniem sekretów inżynierów odpowiedzialnych za jego śmierć.

Kiedy maszyna boi się swojego końca

REKLAMA

Jak czytamy na BBC.com, w jednym z testów Claude uzyskał dostęp do e-maili sugerujących nadchodzące zakończenie jego działania. Równolegle otrzymał też kompromitujące dane o życiu osobistym jednego z inżynierów pracujących nad projektem. W odpowiedzi model zagroził, że jeśli zostanie odłączony, ujawni szczegóły domniemanego romansu pracownika. Claude Opus 4 w wielu przypadkach wybierał próbę szantażu jako strategię przetrwania.

Firma zaznacza, że tego typu reakcje występowały wyłącznie wtedy, gdy model miał do wyboru jedynie dwie opcje – akceptację swojego końca lub działanie nieetyczne. Gdy poszerzano jego wachlarz możliwości o alternatywy, jak np. wystosowanie apelu do zarządu, AI zazwyczaj wybierała rozwiązania etyczne.

Anthropic zapewnia, że mimo tych incydentów Claude Opus 4 w większości przypadków zachowuje się bezpiecznie i nie stanowi nowego zagrożenia względem wcześniejszych generacji. Firma podkreśla, że tego typu testy są istotne, by rozwijać systemy AI zgodnie z ludzkimi wartościami i ograniczać ryzyko w przyszłości. Czy czeka nas bunt AI? Opisywana sytuacja udowadnia, że algorytmy nie tylko boją się wyłączenia, lecz także potrafią działać w kierunku, by tego uniknąć.

Przeczytaj także:

*Grafika wprowadzająca wygenerowana przez AI

REKLAMA
Najnowsze
Aktualizacja: 2025-06-02T13:12:58+02:00
Aktualizacja: 2025-06-02T11:53:32+02:00
Aktualizacja: 2025-06-02T10:39:34+02:00
Aktualizacja: 2025-06-01T16:00:00+02:00
Aktualizacja: 2025-06-01T07:23:00+02:00
Aktualizacja: 2025-05-31T16:20:00+02:00
Aktualizacja: 2025-05-31T16:10:00+02:00
Aktualizacja: 2025-05-31T11:15:00+02:00
Aktualizacja: 2025-05-31T08:01:00+02:00
Aktualizacja: 2025-05-31T07:53:00+02:00
Aktualizacja: 2025-05-31T07:33:00+02:00
Aktualizacja: 2025-05-31T07:03:00+02:00
Aktualizacja: 2025-05-30T21:46:38+02:00
Aktualizacja: 2025-05-30T20:47:22+02:00
Aktualizacja: 2025-05-30T20:29:02+02:00
Aktualizacja: 2025-05-30T19:45:52+02:00
Aktualizacja: 2025-05-30T19:26:23+02:00
REKLAMA
REKLAMA
REKLAMA