Zaledwie 300 tys. dol. – tyle kosztowało stworzenie modelu R1, który w styczniu 2025 r. wywołał poruszenie na amerykańskich giełdach. Chińska firma DeepSeek, która stoi za tym narzędziem, opublikowała właśnie szczegóły dotyczące jego budowy i szkolenia. To pierwszy duży model językowy na świecie, który przeszedł pełen proces recenzji naukowej i został opisany w czasopiśmie Nature.

Dzięki temu R1 stał się nie tylko technologiczną, ale i naukową sensacją. Badacze uznają publikację za ważny krok w kierunku transparentności sztucznej inteligencji. Dotąd większość modeli LLM powstawała w komercyjnych laboratoriach bez szerszego wglądu w to, jak są trenowane i weryfikowane.

Bez kopiowania rywali?

Jednym z najczęstszych zarzutów wobec modeli AI jest to, że uczą się one na treściach wygenerowanych przez inne systemy. W przypadku R1 pojawiły się spekulacje, że model wykorzystywał dane stworzone przez narzędzia OpenAI, co miałoby znacznie przyspieszyć jego rozwój przy ograniczonych zasobach. DeepSeek stanowczo temu zaprzecza, choć przyznaje, że trenował bazowy model na ogólnodostępnych danych z internetu, a więc także na treściach potencjalnie wygenerowanych przez inne AI.

Naukowcy recenzujący publikację uznali te wyjaśnienia za wystarczająco przekonujące, choć jak zawsze w świecie sztucznej inteligencji – pełna pewność nie istnieje. Co ważniejsze, wiele niezależnych zespołów badawczych potwierdza, że osiągnięcia R1 można uzyskać innymi metodami bez konieczności korzystania z danych konkurencji.

Rewolucyjna metoda uczenia

To, co wyróżnia R1 na tle innych modeli, to sposób, w jaki uczy się rozwiązywania problemów. Zamiast naśladować gotowe przykłady rozumowania stworzone przez ludzi, model samodzielnie dochodzi do właściwych odpowiedzi, korzystając przy tym z mechanizmu uczenia przez nagrodę. Co więcej, ocenia swoje próby bez pomocy dodatkowych algorytmów.

Taka samodzielność w nauce pozwoliła R1 wypracować własne strategie rozwiązywania zadań z matematyki, kodowania czy z logiki. Dla badaczy to ogromna zmiana, bo dotąd modele językowe były raczej imitatorami ludzkich wzorców niż kreatywnymi rozwiązywaczami problemów.

Od Chin przez świat do nauki

Od momentu udostępnienia modelu R1 zyskał status najczęściej pobieranego modelu na platformie Hugging Face z liczbą ponad 10,9 mln pobrań. Naukowcy z całego świata zaczęli testować jego możliwości w różnych zadaniach badawczych, m.in. w analizie danych, w programowaniu czy w rozwiązywaniu zagadnień naukowych.

Choć w niektórych testach nie zajmuje on pierwszego miejsca pod względem precyzji, imponuje znakomitym stosunkiem możliwości do kosztów. Czyni go to zatem możliwą alternatywą dla dużo droższych rozwiązań.

Nowy standard w AI?

Publikacja modelu R1 w czasopiśmie Nature to nie tylko dowód na jego skuteczność, ale także znak zmiany paradygmatu naukowego. Przez lata modele sztucznej inteligencji były rozwijane w ciszy i tajemnicy, z dala od oczu środowiska naukowego. DeepSeek pokazuje, że można inaczej – transparentnie, naukowo, a przy tym skutecznie.

Dla świata AI to może być początek nowej ery, w której nie tylko rezultaty, ale i metody tworzenia modeli są przedmiotem otwartej debaty. A to z kolei może zbliżyć sztuczną inteligencję do standardów obowiązujących w nauce i uczynić ją bardziej zrozumiałą, przewidywalną i bezpieczną.

*Źródło zdjęcia wprowadzającego: Primakov / Shutterstock

Marcin Kusz 19.09.2025 06:41

