Xbox ma nowy pomysł na gry i zgodność wsteczną. Trudno o coś równie ohydnego
Potencjalnie rewolucyjna i wywrotowa technologia Microsoft Muse w teorii może fundamentalnie zmienić podejście do projektowania i produkcji gier. Problem w tym, że gracze mogą sobie tej rewolucji nie życzyć. Ja jestem wręcz zdegustowany.

Kiedy Microsoft skierował całą swoją uwagę na technologię sztucznej inteligencji, po całej firmie zaczęły krążyć służbowe notatki o treści brzmiącej mniej więcej tak: jeżeli nie masz w swoim workloadzie pracy związanej z AI, to ty i twój zespół macie problem. Firma, tak jak niegdyś przy okazji popularyzacji chmury publicznej, wprowadziła wewnętrzne pospolite ruszenie.
Do tej pory nie było jasne, co z tym przykazem miał zrobić Xbox i reszta działu gier. Jak się wpasować w nakaz w produktowej dziedzinie, w której nienamacalna wartość tożsamych z grami wideo sztuki i rozrywki są nieraz bardziej istotne od samej technologii? Dziś poznajemy pierwszą z odpowiedzi. Na szczęście, póki co określanej jako naukowy eksperyment.
W co gramy w ten weekend?
Microsoft Muse to imponująca technologia. Generują nowe gry wideo za pomocą AI
Przedstawiony przez Microsoft model Muse, znany również jako World and Human Action Model (WHAM), stanowi znaczący krok w integracji generatywnej sztucznej inteligencji z procesami tworzenia i optymalizacji gier wideo. Opracowany we współpracy z Xbox Game Studios oraz studiem Ninja Theory Muse łączy zaawansowane możliwości generowania wizualizacji, symulacji fizyki gry oraz przewidywania zachowań graczy, oferując narzędzia przydatne zarówno dla deweloperów, jak i entuzjastów retro-gier.
Jego architektura, oparta na połączeniu VQ-GAN i transformera, umożliwia generowanie spójnych sekwencji rozgrywki - choć obecne ograniczenia technologiczne, takie jak niska rozdzielczość wyjściowa (300×180 pikseli), wskazują na konieczność dalszych prac.
Podstawy technologiczne: VQ-GAN i Transformery
Muse wykorzystuje dwie kluczowe komponenty: VQ-GAN (Vector Quantized Generative Adversarial Network) do tokenyzacji obrazów gry oraz autoregresyjny model transformera do przewidywania kolejnych tokenów w sekwencji. VQ-GAN kompresuje klatki gry do tzw. reprezentacji dyskretnych, co pozwala na efektywne przetwarzanie długich sekwencji danych. Transformery, szkolone na miliardach parametrów (np. 1.6B w największej wersji), analizują kontekst historyczny, przewidując zarówno kolejne akcje gracza, jak i odpowiadające im wizualizacje.
Model przeszkolono na danych z Bleeding Edge - wieloosobowej gry akcji studia Ninja Theory. Zbiór danych obejmował ponad 500 tys. rozgrywek, co przekłada się na 1 mld klatek i akcji kontrolera rejestrowanych z częstotliwością 10 Hz. Każda klatka została zredukowana do rozdzielczości 300×180 pikseli, a akcje graczy zakodowano jako 16 dyskretnych wejść (np. kierunki drążka, przyciski). Proces szkolenia trwał pięć dni na 98 procesorach graficznych Nvidia H100, zużywając moc obliczeniową odpowiadającą siedmiu latom ciągłej rozgrywki.
Twórcy WHAM chcą, by to była kuźnia pomysłów. Microsoft mówi jednak o czymś jeszcze
WHAM Demonstrator służy jako platforma do eksperymentów kreatywnych. Deweloperzy mogą:
- Modyfikować istniejące środowiska: Dodając np. nowe postacie do sceny, model generuje realistyczne reakcje AI na wprowadzone zmiany.
- Testować balans rozgrywki: Symulując zachowania graczy w różnych warunkach, twórcy mogą ocenić, czy poziom trudności jest optymalny.
- Eksplorować alternatywne scenariusze: Z tego samego punktu startowego model potrafi wygenerować do 16 różnych zakończeń sekwencji, co pokazuje jego zdolność do tworzenia zróżnicowanych ścieżek narracyjnych.
Tradycyjne testy beta angażujące ludzi są czasochłonne i kosztowne. WHAM teoretycznie zastępuje ludzkich testerów w początkowych fazach rozwoju gry, generując realistyczne symulacje zachowań graczy. W przypadku Bleeding Edge model poprawnie identyfikował nietypowe sytuacje, np. możliwość latania postaci w określonych warunkach, co wymagało iteracyjnego doskonalenia algorytmów.
Przerażająco brzmi jednak coś zupełnie innego i dla mnie ważnego. Jednym z kluczowych zastosowań Muse ma być automatyczna optymalizacja starszych gier pod kątem nowoczesnego sprzętu. Model analizuje oryginalną mechanikę i fizykę gry, rekonstruując ją bez dostępu do źródłowego kodu czy silnika. Przykładowo, gra zaprojektowana dla Windows XP może zostać dostosowana do działania na Xbox Series X lub chmurze Azure, rzekomo zachowując przy tym autentyczność doświadczenia.
Jedną z przyczyn, dla których nadal wybieram Xboxa, jest szacunek Microsoftu do mojej młodości i mojego dzieciństwa. Muse chwieje tą wiarą
Odkąd rządy nad Xboxem i Microsoft Gaming sprawuje Phil Spencer, platforma stała się zdecydowanie bardziej atrakcyjna dla graczy. W tym w kwestii miłośników starszych gier. Microsoft włożył niemało wysiłku, by zapewnić graczom tak daleko idącą wsteczną kompatybilność ze starymi grami, jak tylko to możliwe. Najnowsze konsole Xbox bez problemu odtworzą niemal wszystkie gry z Xboxa One, znaczną część z Xboxa 360, a nawet wybrane tytuły z Xboxa najpierwszej generacji. Posiadacz Xbox Series X może umieścić DVD z grą Gears of War na Xboxa 360 w napędzie konsoli, a gra po prostu będzie działać. Należę do tej grupy graczy, którzy chętnie i z nostalgią wracają do gier swojej młodości. Xbox wydaje się to rozumieć. Sęk w tym, że zgodność wsteczna to niełatwe zadanie. Zwłaszcza w świecie konsol do gier.
Stara gra przeportowana lub emulowana byle jak na nowym sprzęcie i nowym systemie operacyjnym może działa najczęściej wadliwe. Problemy mogą leżeć w dźwięku, w grafice czy nawet w samej mechanice gry. Nawet rodzaj wyświetlacza ma znaczenie - dla przykładu, najlepsze studia deweloperskie zajmujące się odnawianiem starych gier zwracają uwagę nawet na emulację sposobu pracy kineskopowego telewizora. Bo nieraz stare gry wykorzystywały jego specyfikę i bez żadnej modyfikacji wyglądając istotnie gorzej na panelach LCD i OLED. A to przecież tylko kosmetyka. Równie kluczowa jest wspominana mechanika.
Przecież o sukcesie i porażce danej gry mogą decydować literalnie milisekundy. Jeżeli, dla przykładu, jakaś strzelanka ma śliczną grafikę, ale jest ociężała i kiepsko się w niej strzela - bo kod odpowiedzialny za ten element jest wysoce niedoskonały - to gracze ją zapewne porzucą. Tymczasem Microsoft chce przywracać stare gry metodą aproksymacji AI. Wysoce powierzchowną analizą.
Mam nadzieję, że do tego nie dojdzie
Ignorowanie AI jako przydatnego narzędzia pracy, w tym w świecie gamedevu, to oczywista głupota. Potencjał tej technologii jest przeogromny, zresztą znamy już jej bardzo korzystne dla graczy wykorzystanie - mam na myśli Nvidia DLSS, za sprawą którego układy graficzne są niezestawialnie efektywniej wykorzystywane, umożliwiając tworzenie jeszcze atrakcyjniejszych wizualnie gier.
Mam jednak ogromną nadzieję, że Microsoft nigdy, ale to nigdy nie zaproponuje mi na Xboksie klasycznej gry z MS-DOS odtworzonej przez AI. Sztuczna inteligencja bez wglądu do kodu źródłowego nie będzie miała dostatecznej ilości informacji, by odtworzyć daną grę, bo nie wszystkie niuanse są widoczne na materiale wideo z rozgrywki. Czasem nawet uruchomienie oryginalnej gry w niedoskonałym emulatorze psuje jakość oryginału technicznie lub audiowizualnie, a tu mowa o przybliżeniu i halucynacjach algorytmu. Dziękuję za takie fałszowanie historii, Xbox umie robić to lepiej. Mam nadzieję, że nie przestanie i nie ulegnie temu dzikiemu pędowi na AI. Nie jest to tego warte.