REKLAMA

Europa chce własnego ChataGPT. Jedna kluczowa różnica

Europa chce własnego modelu AI klasy frontier. Projekt EUROPA ma obsługiwać 24 języki UE i dać firmom większą kontrolę nad danymi. Czy wygryzie ChataGPT?

Włoska Domyn buduje europejski model AI. Ma być open source
REKLAMA

Europa przez lata przyglądała się wyścigowi AI, ale tylko się przygląda. Teraz Włosi chcą to zmienić i zapowiadają model sztucznej inteligencji klasy frontier, otwarty, wielojęzyczny i możliwy do uruchomienia na własnej infrastrukturze. Jeśli Domyn dowiezie tę obietnicę, to Europa zyska nie tyle własnego ChatGPT, ile coś znacznie ważniejszego: narzędzie, którego nie trzeba ani wynajmować od Amerykanów, ani ściągać z Chin.

REKLAMA

Chcemy przestać być tylko klientem cudzej AI

Włoska firma Domyn, wcześniej znana jako iGenius, zapowiada, że w ciągu roku wypuści w pełni open-source’owy model sztucznej inteligencji klasy frontier. Ma mieć ponad 400 mld parametrów i być trenowany od zera. To skala, którą zwykle kojarzymy z największymi systemami AI na świecie, choć sama liczba parametrów nie przesądza jeszcze o jakości modelu.

Chyba najważniejsze jest jednak to, że model ma być otwarty i możliwy do odtworzenia. Firmy oraz instytucje publiczne mogłyby uruchamiać go u siebie, na własnej infrastrukturze, bez wysyłania danych do zagranicznej chmury. Dla banku, szpitala, urzędu czy firmy z sektora obronnego może to być naprawdę kluczowa różnica.

Tu nie chodzi wyłącznie o to, kto ma najlepszy interfejs do pisania maili czy innych pierdół. Chodzi o dane, jurysdykcję, kontrolę, koszty, bezpieczeństwo i możliwość audytu. Jeśli europejska firma korzysta z amerykańskiego modelu hostowanego za granicą, to nawet przy najlepszych umowach pozostaje zależna od cudzej infrastruktury, cudzego prawa i cudzych decyzji biznesowych. 

REKLAMA

Domyn wygrała unijny wyścig o model frontier

Cały projekt prowadzi konsorcjum EUROPA, na którego czele stoi Domyn. Współpracuje z nim m.in. niemiecki Fraunhofer-Gesellschaft, jedna z najważniejszych organizacji badawczo-przemysłowych w Europie. Konsorcjum zostało wybrane przez Komisję Europejską w ramach Frontier AI Grand Challenge.

Projekt jest wpisany w szerszą strategię budowania europejskich kompetencji AI. Model ma obejmować wszystkie 24 języki urzędowe Unii Europejskiej, czyli dokładnie ten obszar, w którym amerykańskie i chińskie systemy często zawodzą. Potrafią pisać po polsku, czesku czy litewsku, ale bardzo często widać, że te języki są dla nich dodatkiem do angielskiego świata, a nie równorzędną podstawą.

Open source to tak naprawdę sedno sprawy

Największa różnica między europejskim planem a dominującym modelem amerykańskim polega przede wszystkim na otwartości. OpenAI, Anthropic czy Google oferują potężne systemy, ale najczęściej działające jako usługi. Użytkownik dostaje dostęp do modelu, a nie model. Może z niego korzystać, ale nie ma pełnej kontroli nad wagami, procesem trenowania, infrastrukturą i możliwością niezależnego wdrożenia.

REKLAMA

Domyn obiecuje model open source, który firmy i rządy będą mogły uruchamiać samodzielnie. Będzie to jest szczególnie ważne dla sektorów regulowanych. Banki, administracja, przemysł, energetyka, zdrowie czy obronność nie zawsze mogą po prostu wrzucić dane do komercyjnej usługi i zaufać, że wszystko będzie dobrze.

W tekście: OpenAI chce ratować Europę. Brzmi jak początek kłopotów Maciek jakiś czas temu pisał, że amerykańska pomoc w budowaniu suwerennej AI może wyglądać jak prezent, ale w praktyce pogłębiać zależność od USA. Europejskie projekty, takie jak EuroLLM i OpenEuroLLM, miały być odpowiedzią: otwartą, transparentną i zgodną z europejskimi regulacjami. Domyn próbuje wejść poziom wyżej, od modeli przydatnych i lokalnych do modelu naprawdę dużego, który może konkurować z globalną czołówką.

REKLAMA

DeepSeek i Qwen pokazały Europie, że da się inaczej

Europejska mobilizacja jest poparta tym, że Amerykanie dominują w zamkniętych modelach, ale Chińczycy bardzo mocno rozpychają się w open source. DeepSeek i Qwen pokazały, że otwarty lub szeroko dostępny model może stać się globalnym narzędziem wpływu. Nawet jeśli nie jest najlepszy w każdym benchmarku, może wygrać ceną, dostępnością i łatwością wdrożenia.

REKLAMA

Świetny tekst przygotowali o tym Marek Szymaniak i Rafał Pikuła na łamach Spider’s Web+. Znajdziecie go tutaj. DeepSeek uświadomił Zachodowi, że przewaga nie zawsze polega na zamknięciu modelu za najdroższym API. Czasem większą siłę daje otwartość, bo tysiące firm, badaczy i programistów zaczynają pracować na tym samym fundamencie.

REKLAMA

Dla Europy to jednocześnie szansa, jak i sygnał ostrzegawczy. Jeśli nie stworzymy własnych otwartych modeli, zostaniemy z wyborem między amerykańską chmurą a chińskim open source’em. To trochę jak decydowanie się na jeden z dwóch cudzych systemów operacyjnych dla gospodarki przyszłości. Domyn próbuje pokazać, że może istnieć jeszcze trzecia opcja.

400 mld parametrów brzmi imponująco, ale to nie wystarczy

Ponad 400 mld parametrów brzmi imponująco i faktycznie stawia projekt wśród największych otwartych modeli, o jakich słyszeliśmy. Tyle że sama liczba to jeszcze nie wszystko. Parametry nie są miarą inteligencji. Model może być ogromny, a jednocześnie przeciętny, jeśli stoi za nim słaba jakość danych, źle zaplanowany trening, niedopracowane dostrojenie albo zbyt powierzchowne testy bezpieczeństwa.

REKLAMA

W ostatnich latach branża nauczyła się, że jakość modelu zależy nie tylko od rozmiaru. Liczą się dane treningowe, architektura, wydajność inferencji, umiejętność rozumowania, obsługa narzędzi, praca z długim kontekstem, odporność na halucynacje, bezpieczeństwo i koszt uruchomienia. Dla firm równie ważne jak odpowiedź modelu jest to, czy da się go stabilnie wdrożyć, utrzymać i kontrolować.

To szczególnie istotne, bo europejskie modele nie zawsze zachwycały praktycznymi wynikami. W tekście: Polskie boty to tumany. Nasze modele poległy na testach z języka i kultury polskiej Malwina słusznie zauważa, że lokalność i patriotyczna etykieta nie wystarczą. Model może być europejski, polski czy zgodny z regulacjami, ale jeśli przegrywa z globalną konkurencją w codziennych zadaniach, użytkownicy i tak wybiorą to, co działa lepiej. Dlatego Domyn nie będzie oceniana za ambicję. Będzie oceniana przede wszystkim za wyniki.

Europa ma superkomputery, ale wciąż ma problem z mocą

Model tej skali wymaga potężnej infrastruktury obliczeniowej. Domyn ma korzystać z europejskiego zaplecza superkomputerowego i wpisuje się w unijne plany AI Factories oraz AI Gigafactories. To ma sens, bo jeśli Europa chce mieć własne modele, nie może trenować ich wyłącznie na cudzych chmurach.

REKLAMA

Pisał o tym Maciek w tekście: Europa wstała z kolan. Mamy jasny plan na walkę z Chinami i USA. Komisja Europejska próbuje budować pakiet obejmujący chipy, chmurę, AI, open source i infrastrukturę obliczeniową. To wreszcie wygląda jak myślenie całym stosem technologicznym, a nie tylko kolejną deklaracją o wartościach.

Problem polega na tym, że USA i Chiny nie stoją w miejscu. Amerykańskie firmy mają gigantyczny kapitał, dostęp do najnowszych akceleratorów, ogromne centra danych i rynek, który pozwala im natychmiast monetyzować najlepsze modele. Chiny mają wsparcie państwa, wielki rynek wewnętrzny i rosnący ekosystem open source. Europa ma świetnych badaczy, dobre regulacje i coraz więcej infrastruktury, ale nadal musi udowodnić, że potrafi z tego zrobić produkt, który ktoś będzie chciał używać.

REKLAMA

Czy ktoś w ogóle będzie chciał tego używać?

Największym ryzykiem dla Domyn jest nie to, że model nie powstanie. Największym ryzykiem jest to, że powstanie, ale będzie traktowany jak projekt polityczny, a nie jako praktyczne narzędzie. Europa zna takie historie: wielkie ambicje, konferencje, konsorcja, regulacje, a potem ciche zderzenie z produktem, który jest wolniejszy, droższy albo mniej wygodny od amerykańskiej konkurencji.

Dlatego kluczowe będą tu trzy rzeczy: jakość, koszt i wdrożenie. Model musi być wystarczająco dobry, żeby nie trzeba było przepraszać użytkownika za europejskość. Musi dać się uruchamiać w rozsądnych kosztach, bo 400 mld parametrów to także potężne wymagania sprzętowe. I musi mieć narzędzia, dokumentację, społeczność oraz integracje, bez których nawet najlepszy model zostaje ciekawostką i tyle.

Przeczytaj także:

REKLAMA

Open source daje tu wielką przewagę. Jeśli model będzie naprawdę otwarty, społeczność może go dostrajać, optymalizować, kompresować, testować i adaptować do konkretnych zastosowań. Ale open source nie jest magicznym zaklęciem. Trzeba jeszcze dowieźć jakość startową, licencję, dane, bezpieczeństwo i tempo rozwoju.

*Grafika wprowadzająca wygenerowana przez AI

REKLAMA
Marcin Kusz
Redaktor

O nowych technologiach zaczął pisać jeszcze w 2012 r. na łamach portalu Telix. Później przez pewien czas pisał dla Komputer Świata i PCLabu. Epizod dziennikarski zaliczył także w lokalnej gazecie i w dziale blogowym SpeedTest. Współzałożyciel agencji BlueCopy, zajmującej się copywritingiem i poligrafią. Przez pewien czas właściciel firmy transportowej. Prywatnie fan starych polskich oper mydlanych (oglądanych obowiązkowo z konkubiną), dumny opiekun kotki brytyjskiej i pasjonat-amator druku 3D.

REKLAMA
REKLAMA
REKLAMA
REKLAMA