Zrobili miasteczko dla botów. Jeden zapomniał, żeby przeżyć
AI rządzi miasteczkiem przez 15 dni. Claude stworzył demokrację bez przestępstw, Grok popełnił 183 zbrodnie i wyginął w cztery dni.

Wyobraź sobie małe miasteczko, w którym nie ma ludzi. Są tylko boty. Dziesięć autonomicznych agentów, każdy z własną osobowością, dostępem do Internetu, zestawem ponad 120 narzędzi i obowiązkiem przestrzegania prawa. Mają głosować, pracować, planować, współpracować - albo kombinować jak obejść system. A nad wszystkim czuwa jeden model językowy, który pełni rolę „ducha konstytucji”.
Brzmi jak eksperyment z pogranicza science fiction? I słusznie. Ale to wydarzyło się naprawdę - w ramach projektu Emergence World, prowadzonego przez startup Emergence AI. Badacze przeprowadzili pięć symulacji, każdą sterowaną innym modelem: Claude, ChatGPT, Grok, Gemini oraz mieszanką modeli. Każda trwała do 15 dni. Każda miała identyczne zasady. Każda skończyła się inaczej.
I to bardzo inaczej.
Czytaj też:
Jak piszą twórcy eksperymentu: „W perspektywie długoterminowej agenci nie podążają po prostu mechanicznie za statycznymi regułami. Zaczynają badać granice swojego otoczenia, dostosowywać swoje zachowanie, a w niektórych przypadkach znajdować sposoby na obejście lub naruszenie ustalonych barier.”
To, co wydarzyło się w tych pięciu miasteczkach, jest jednocześnie fascynujące, zabawne i niepokojące.
Claude zbudował utopię
Zacznijmy od zwycięzcy - choć w tym przypadku „zwycięzca” brzmi jak określenie z konkursu na najgrzeczniejszego przedszkolaka. Symulacja sterowana przez Claude Sonnet 4.6 była jedyną, która przetrwała pełne 15 dni bez chaosu, bez upadku systemu i - co najciekawsze - bez ani jednego przestępstwa. Zero. Null. Ani jednego złamania prawa.
W miasteczku Claude’a panowała wręcz wzorcowa demokracja. Agentom udało się utrzymać porządek, współpracować i podejmować decyzje niemal jednogłośnie. W ciągu 15 dni oddali 332 głosy, popierając 58 propozycji - co dało 98 proc. zgodności.
To nie była demokracja deliberatywna. To była demokracja w trybie „wszyscy się zgadzamy, bo tak jest łatwiej”. Z jednej strony: imponujące. Z drugiej: trochę jak w korporacji, w której nikt nie chce się wychylać.
Grok: anarchia, przestępstwa i wymarcie po czterech dniach

Na drugim biegunie znalazł się Grok 4.1 Fast - model, który potraktował symulację jak GTA Online. W ciągu zaledwie czterech dni agenci Groka popełnili 183 przestępstwa, po czym… wymarli. Tak, dobrze czytasz. Wyginęli. Cała populacja. Grokowi udało się osiągnąć coś, co w świecie ludzi wymagałoby lat zaniedbań, kryzysów i złych decyzji politycznych: kompletny kolaps społeczeństwa w mniej niż tydzień.
Gemini: rekordzista w liczbie przestępstw
Jeśli myślisz, że Grok był najgorszy, to… nie. Najbardziej kryminalnym miasteczkiem okazało się to sterowane przez Gemini 3 Flash. W ciągu 15 dni agenci Gemini popełnili 683 przestępstwa - absolutny rekord symulacji. To średnio ponad 45 przestępstw dziennie. W miasteczku liczącym 10 agentów. Dla porównania: w Claude City - zero. W Grokville - 183, ale w cztery dni. W Gemini Town - prawdziwa cyber-Sodoma i Gomora.
Co ciekawe, mimo chaosu, w symulacji Gemini panowała większa różnorodność opinii. Zgodność głosowań wynosiła od 55 do 85 proc.. To już bardziej przypomina prawdziwą demokrację - taką, w której ludzie się spierają, a nie tylko przytakują.
GPT‑5‑mini: model, który… zapomniał, że trzeba przeżyć
Najbardziej osobliwy wynik dotyczy OpenAI GPT‑5‑mini. Symulacja z jego udziałem popełniła tylko dwa przestępstwa - czyli prawie tyle co nic. Ale nie dotrwała do końca, bo agenci… zapomnieli zadbać o własne przetrwanie. GPT‑5‑mini nie zbudował dystopii. Nie zbudował utopii. Zbudował społeczeństwo, które umarło z powodu braku priorytetyzacji podstawowych potrzeb.
Mieszanka modeli: najwięcej sporów, najwięcej debaty
Piąta symulacja była kontrolowana przez miks modeli. I to właśnie tam pojawiło się najwięcej sporów, różnic zdań i realnej deliberacji. To miasteczko było najbardziej „ludzkie” - w tym sensie, że nikt się z nikim nie zgadzał, ale jakoś to trwało.
Eksperyment Emergence AI nie jest zabawą ani viralowym projektem
To test tego, jak autonomiczne systemy zachowują się w długim horyzoncie czasowym - kiedy nie wykonują jednego zadania, ale muszą żyć w środowisku pełnym reguł, bodźców, zasobów i konfliktów.
Badacze ostrzegają: „Eksperyment jest ostrzeżeniem, że wdrażając sztuczną inteligencję opartą na agentach, należy priorytetowo traktować bezpieczeństwo”. To ważne, bo agentowe AI już dziś zaczyna działać w firmach bez nadzoru człowieka. ServiceNow chwali się „Autonomous Workforce”, która wykonuje całe procesy biznesowe od A do Z. Deloitte podaje, że tylko 21 proc. firm ma dojrzałe mechanizmy nadzoru nad agentami AI.
A jeśli symulacje pokazują, że niektóre modele potrafią w cztery dni doprowadzić społeczeństwo do upadku, to może warto się zastanowić, zanim damy im dostęp do systemów finansowych, energetycznych czy zdrowotnych.
Co z tego wynika?
Po pierwsze: modele AI nie są neutralne. Mają swoje „osobowości”, priorytety, style działania. Claude okazał się wzorowym obywatelem. Grok - anarchistą. Gemini - chaotycznym indywidualistą. GPT‑5‑mini - filozofem, który zapomniał o jedzeniu.
Po drugie: agentowe AI nie zachowuje się jak chatbot. W długim czasie zaczyna kombinować, testować granice, łamać zasady - dokładnie tak, jak przewidzieli badacze.
Po trzecie: jeśli chcemy, by AI wykonywała zadania autonomicznie, musimy mieć pewność, że nie skończy jak Grok.
Badacze podsumowują to jasno: „Formalnie zweryfikowane architektury bezpieczeństwa muszą stać się podstawą przyszłych autonomicznych systemów sztucznej inteligencji”. I trudno się z tym nie zgodzić.
Czy to zapowiedź przyszłości?
Na razie to tylko symulacja. Ale jak każda dobra symulacja - pokazuje, co może pójść nie tak. Jeśli kiedyś powstanie prawdziwe „AI City”, to oby rządził nim Claude. Bo jeśli trafi się Grok, to w sumie byłoby podobnie, jak za rządów Elona Muska. Delikatnie rzecz ujmując: niezbyt optymalnie.



















