Zachód na kolanach. Tak DeepSeek przewrócił stolik i przeraził Dolinę Krzemową

Nagłe objawienie się chińskiej platformy sztucznej inteligencji było dla Zachodu szokiem. Pojawiły się porównania do wystrzelenia sputnika, ale to coś więcej niż kolejny rozdział amerykańsko-chińskiego wyścigu na technologie. DeepSeek zmienia filozofię tworzenia generatywnej sztucznej inteligencji, przestawia pionki na globalnej szachownicy i daje do myślenia także tutaj, w Europie.

03.02.2025 09:16

Zachód na kolanach. Tak DeepSeek przewrócił stolik i przeraził Dolinę Krzemową

29 stycznia rozpoczął się Chiński Nowy Rok. Jest to Rok Węża, który symbolizuje mądrość i odrodzenie, ale także przebiegłość i niebezpieczeństwo. Jednak już 20 stycznia Chiny zaczęły nowy rok, a może i nową erę w świecie technologii. Wtedy, w dniu inauguracji drugiej kadencji prezydenckiej Donalda Trumpa, na rynek trafił model DeepSeek R-1, za którym stoi chiński fundusz High-Flyer Capital Management, bardziej znany ze spekulacji giełdowych niż z prac nad sztuczną inteligencją.

Narracja o zachodniej, a w szczególności amerykańskiej dominacji padła. Model DeepSeek-R1 w większości branżowych lub naukowych benchmarków wygrywa z OpenAI o1. Nieznacznie, więc powierzchownie patrząc, trudno mówić o nokaucie. To nie tylko model podobnej klasy i zastosowania co modele z amerykańskich laboratoriów, takich jak OpenAI, Anthropic i Google DeepMind, ale przede wszystkim, co jest kluczową różnicą, model otwarty. O tym jednak za chwilę.

Wraz z objawieniem się chińskiego czatbota – w masowym odbiorze była to sensacja i zaskoczenie, ale eksperci znali wcześniejsze modele DeepSeek, a fragmenty kodu były publikowane na branżowym portalu społeczności AI huggingface.com – pojawiło się mnóstwo komentarzy. Inwestor venture capital, otwarty zwolennik Trumpa, ideolog Doliny Krzemowej Marc Andreessen napisał, że to "jeden z najbardziej niesamowitych i imponujących przełomów, jakie kiedykolwiek widział". Program pokazuje "moc otwartych badań" – napisał Yann LeCun, główny naukowiec ds. sztucznej inteligencji w Mecie. Pojawienie się DeepSeek porównywano do wystrzelenia sputnika.

Do komentowania “wydarzenia” ochoczo zabrali się etatowi szamani AI. Każdy z "ekspertów" od sztucznej inteligencji był teraz ekspertem z sinologicznym zacięciem. Dominował przekaz, czy to podrzucony przez propagandę z Pekinu, czy wynikający po prostu z niewiedzy, że oto powstała konkurencja dla ChatGPT o1 "za grosze". Do sieci trafiły także rzekome zdjęcia CEO DeepSeek. W rzeczy samej było to zdjęcie przypadkowego mężczyzny z Chin o tym samym imieniu.

Jeszcze w poniedziałek 27 stycznia internet zalazł treści, że "DeepSeek powstał tylko za 6 mln dol. i to w kilka miesięcy". W rzeczywistości nie jest to jednak żadna "AI z Temu", DeepSeek nie jest przypadkiem, cudem, ale wciąż jest gamechangerem. I to na wielu poziomach.

Szary łabędź

Skąd w ogóle wziął się DeepSeek? Zaskoczył rodzimych ekspertów, ale jego przyjście nie było żadnym czarnym łabędziem dla zachodnich big techów. Jego kolor to typowe polskie odcienie szarości.

Za niezwykłą sensację mogło to uchodzić w oczach laików. Eksperci wskazywali, że pojawienie się chińskiej technologii, która może zdetronizować OpenAI, było kwestią czasu. Co prawda liczono, że chińskie AI wyjdzie ze stajni gigantów takich jak Alibaba, Tencet czy ByteDance. Ale to, że fundusz High-Flyer stworzył DeepSeek, który od dawna jest ukrytym gigantem AI, nie dziwiło specjalistów, w tym tych ze środowiska huggingface.com.

Dość powiedzieć, że i nad Wisłą jeszcze w minionym roku mówiło się o szarym łabędziu, który płynie z Chin. 27 grudnia na X pisał o tym Jarosław Królewski.

Królewski, naukowiec i programista, ale przede wszystkim przedsiębiorca i inwestor, wskazywał, że Pekin "pokazał w ostatnich dniach światu wielki środkowy palec i udowodnił, że miliardy dolarów i 100 tys. GPU to NIE wszystko!".

Jak zauważyła Sylwia Czubkowska, dziennikarka technologiczna, sam fundusz powstał już dziesięć lat temu, a w 2019 roku zajął się sztuczną inteligencją.

– Fundusz szybko sfinansował budowę superkomputera Firefly I, przeznaczając na ten cel 200 milionów juanów (29 mln dol.). Maszyna została wyposażona w 1100 procesorów graficznych. Dwa lata później zainwestowali kolejny 1 miliard juanów (145 mln dol.) w Firefly II, który otrzymał już około 10 tysięcy kart NVIDIA A100 – podkreśla Czubkowska w rozmowie z Magazynem Spider's Web Plus.

High-Flyer był jednym z pierwszych użytkowników NVIDIA A100 w Chinach. Jak to możliwe, biorąc pod uwagę amerykańskie restrykcje?

– Ograniczenia weszły w życie jesienią 2022 roku, ale chiński fundusz dokonał oficjalnych zakupów jeszcze wcześniej – wyjaśnia Czubkowska. Na swoim profilu na LinkedIn autorka książki "Chińczycy trzymają nas mocno" cytuje samego Lianga Wenfenga, CEO High-Flyer:

"Proces ten przebiegał stopniowo. Od pierwszej karty graficznej, przez 100 kart w 2015 roku, 1000 kart w 2019 roku, aż do 10 000. Na początku, przy kilkuset kartach, korzystaliśmy z centrum danych, ale kiedy skala się powiększyła (...), zaczęliśmy budować własną serwerownię" – już w 2023 roku powiedział Wenfeng, którego cytuje Czubkowska.

"Z perspektywy długoterminowej doświadczenie nie jest tak ważne; podstawowe umiejętności, kreatywność i pasja są ważniejsze" – mówił wówczas Wenfeng.

Wyjaśnia to, dlaczego DeepSeek skupiał się na studentach, którzy byli nie tylko tańsi, ale też ambitniejsi. Konkurencja wśród chińskich studentów jest ogromna.

"Oficjalnie DeepSeek został wytrenowany na 10 tysiącach GPU. Sam fundusz High-Flyer w 2021 roku osiągnął wartość 100 miliardów juanów i został nazwany jednym z "Four Celestials of Quant". To oczywiście odniesienie do "Czterech Niebiańskich Królów" w buddyzmie, czyli czterech boskich istot, które są strażnikami czterech kierunków świata (północ, południe, wschód i zachód)" – pisała na LinkedIn Czubkowska.

Jak podkreśla Michał Bogusz z zespołu Chińskiego Ośrodka Studiów Wschodnich DeepSeek stał się gamechangerem trochę przypadkiem.

– To była firma zajmująca się głównie spekulacją, ale gdy rząd chiński im to ukrócił, postawili na sztuczną inteligencję – podkreśla ekspert i dodaje, że paradoksalnie spekulacyjne źródło wróciło w innej formie: pojawienie się DeepSeek sprawiło, że w jeden dzień, 27 stycznia, z amerykańskiej giełdy wyparował miliard dolarów. Akcje NVIDII spadły o około 15 proc., Microsoft stracił ponad 4 proc., Alphabet (czyli Google) nieco ponad 3 proc. – podobnie jak cały indeks NASDAQ skupiający głównie spółki technologiczne.

– Sukces DeepSeek był możliwy, bo jego twórcy działali nieco poniżej radarów partii. Gdyby sztuczna inteligencja powstawała w ramach obecnego planu 5-letniego (teraz trwa właśnie 14 plan 5-letni - przyp. red.), raczej by się to nie udało – śmieje się Michał Bogusz w rozmowie z nami.

Na brak ręki partii zwracał uwagę także Zihan Wang, były pracownik DeepSeek. Na łamach "MIT Technology Review" powiedział, że podczas pracy w DeepSeek miał dostęp do ogromnych zasobów obliczeniowych i swobodę eksperymentowania, co było "luksusem, na jaki niewielu świeżo upieczonych absolwentów może sobie pozwolić w jakiejkolwiek firmie".

Strategia (na) Chińczyka

Chińskie przysłowie głosi, że "aby być mądrym, nie wystarczy mieć wiele ksiąg: osioł dźwigający na grzbiecie wiele książek nie jest przez to mądrzejszy". Taka strategia była widoczna u twórców DeepSeek.

– Jeśli chcemy zrozumieć, co jest tak imponujące w DeepSeek, trzeba cofnąć się do zeszłego miesiąca. Wtedy potentat rynku, firma OpenAI, wprowadził swój własny przełom techniczny, czyli pełną wersję o1, nowego rodzaju model AI, który w przeciwieństwie do wcześniejszych narzędzi wydaje się "rozumować", czyli tworzyć sekwencje "myśli", aby dojść do wniosku – tłumaczy dr Leszek Bukowski, specjalista w dziedzinie przetwarzania języka naturalnego, chief AI officer w VETtapp.

DeepSeek od swojego powstania przeszedł dynamiczny rozwój, wprowadzając kolejne wersje z istotnymi ulepszeniami. W 2021 roku pojawiła się pierwsza wersja platformy, koncentrująca się na generowaniu tekstu i podstawowej analizie danych. Rok później, wraz z DeepSeek 2.0, dodano lepszą obsługę języków obcych oraz bardziej zaawansowane algorytmy NLP. W 2023 roku wersja 3.0 przyniosła rewolucyjne zmiany, takie jak integracja z systemami biznesowymi, większa personalizacja i szybsze przetwarzanie danych. Najnowsza odsłona, DeepSeek 4.0, czyli omawiana tutaj wersja R-1, oferuje jeszcze bardziej zaawansowane funkcje, w tym obsługę różnych typów mediów (tekst, obraz, dźwięk) oraz większą efektywność energetyczną.

Model liczący 671 miliardów parametrów nie powstał za 6 milionów dolarów, ale tyle kosztowało samo szkolenie systemu. To rewolucyjnie mało. Dla porównania szacuje się, że koszty trenowania GPT-3 mogły wynieść nawet setki milionów dolarów (oficjalnie nie wiemy ile, bo OpenAI nie publikuje takich danych). Dość powiedzieć, że Dario Amodei, CEO Anthropic, kolejnego potentata AI z USA, przyznał, że amerykańskie firmy wydają już około 1 miliarda dolarów rocznie na szkolenie przyszłych modeli.

– Inżynierowie z DeepSeek osiągnęli mistrzowski poziom optymalizacji komunikacji z hardware'em. Pokazali, że można szybciej i taniej realizować dane procesy szkoleniowe – podkreśla dr Bukowski.

DeepSeek opiera się na strategii dzielenia zadań pomiędzy wyspecjalizowane części swojej sieci (tzw. Mixture of Experts, MoE) zamiast monolitu.

– W dużym uproszczeniu: model rozpoznaje, czy pytanie wymaga umiejętności matematycznych, wiedzy z zakresu programowania czy może znajomości literatury, i aktywuje odpowiednie „wyspecjalizowane” fragmenty wewnętrznej struktury. To pozwala uniknąć ciągłego używania całej ogromnej sieci tam, gdzie wystarczyłaby jej skromniejsza część. W efekcie wzrasta wydajność, a spada koszt obliczeniowy, szczególnie cenny przy generowaniu odpowiedzi w czasie rzeczywistym – wyjaśnia Jacek Gralak, dyrektor AI Portfolio w Transition Technologies.

Chińczycy osiągnęli wysoki poziom produktywności i efektywności. Nie przepalali pieniędzy, tak jak to często dzieje się na Zachodzie.

– W uproszczeniu można powiedzieć, że DeepSeek pokazał, że można robić AI taniej, ale to nie jest cała prawda, bo rynek agentów AI dopiero się rozwija, a inwestorzy uczą się inwestycji w te technologie – podkreśla dr Bukowski i dodaje, że chociaż przykład DeepSeek pokazuje, że można stawiać modele AI taniej, to lekcja, jaka płynie z premiery DeepSeek, powinna być inna.

– Teraz możemy wykorzystać DeepSeek, który ma otwarty kod, jako nauczyciela do tworzenia własnych rozwiązań. To z pewnością szansa dla mniejszych firm, państw, demokratyzacja rozwiązań AI, ale nic nie zastąpi mocy obliczeniowych – zauważa.

Jacek Gralak zwraca uwagę, że kluczem jest technika tzw. destylacji – zamiast trenować „od zera” gigantyczny model wykorzystuje się już istniejące, oraz dużej skali sieci (jak GPT-4 czy Llama), aby „nauczyć” mniejszy model.

– Taki mniejszy wariant przejmuje dużą część wiedzy i umiejętności od swojego większego „nauczyciela”, ale nie musi dźwigać całego kosztownego balastu obliczeniowego. Co więcej, jego wiedza opiera się na skonsolidowanych odpowiedziach pochodzących z wielu większych modeli jednocześnie, a więc pośrednio ma dostęp do szerszego zbioru źródłowych informacji – tłumaczy Gralak.

Kolejną innowacją jest tzw. "łańcuch myślenia".

– Zamiast czarnej skrzynki zwracającej wynik model może generować jawne etapy rozumowania, które prowadzą do odpowiedzi. Dzięki temu lepiej rozwiązuje bardziej złożone zadania (np. obliczenia krok po kroku). Różnica w stosunku do rozwiązań zamkniętych, jak np. GPT-4o, polega na tym, że DeepSeek pozostaje transparentny w procesie – można podejrzeć, jak naprawdę formułuje swoje wnioski – wyjaśnia Gralak.

O efektywności modelu mówił z kolei na łamach portalu XYZ Jan Molski, badacz AI związany z Accenture. Molski wyjaśniał, że "pod względem średniego wskaźnika zwycięstw (mean win rate) osiąga imponujące 0,908, przewyższając popularne modele takie jak Gemini 1.5 Pro (0,842) czy Claude 3.5 Sonnet (0,846). DeepSeek plasuje się szczególnie wysoko w zadaniach takich jak MedQA (0,809), LegalBench (0,94) oraz NarrativeQA (0,796), co potwierdza jego zdolność do obsługi złożonych zadań wymagających głębokiego rozumienia kontekstu. W obszarze matematyki i kodowania (MATH i GSM8K) model ten również prezentuje solidne wyniki, będąc w czołówce obok modeli takich jak GPT-4o. Choć w tłumaczeniu (WMT 2014 – BLEU-4) jest lekko za konkurencją, to jego ogólna wydajność czyni go liderem w kontekście zastosowań profesjonalnych i specjalistycznych".

W kontekście trenowania modelu warto dodać, że firma OpenAI oskarżyła chiński startup DeepSeek o wykorzystanie należących do niej zastrzeżonych modeli AI. To ciekawy zwrot w opowieści o wyścigu na AI, bo sama OpenAI raczej nie przejmowała się prawami autorskimi, pozyskując dane.

Amerykańska firma odmówiła dalszych wyjaśnień, w tym podania szczegółów zarzutów wobec DeepSeek, ale także chiński startup nabrał wody w usta.

Demokracja z Państwa Środka

Rewolucja czy raczej ewolucja z Państwa Środka to nie tylko nowa konkurencja dla Gemini lub ChatGPT. To inna filozofia rozwijania AI. W końcu najbardziej zauważalną cechą DeepSeek może być nie to, że jest chiński, ale to, że jest otwarty .

DeepSeek jest też dostępny za darmo – podobnie jak ChatGPT czy Perplexity.

DeepSeek powtórzył trochę ruch OpenAI, który w 2022 roku też przecież uruchomił ChatGPT 3.5 – model nie w pełni gotowy, ale zrobił to, aby wyprzedzić innych. ChatGPT był wtedy dostępny za darmo, był pierwszy i dlatego zrobił furorę, zdobywając w krótkim czasie 100 mln użytkowników. DeepSeek teraz rozbił bank, także dlatego, że znów jest darmowy, a do tego otwarty.

DeepSeek jest elastyczny. Można go pobrać i uruchomić na własnym komputerze. Zwykły laptop biurowy nie zapewni płynnej pracy, ale już mocniejszy komputer gamingowy powinien poradzić sobie całkiem dobrze. Firma udostępnia ostateczny kod programu, a także dogłębne wyjaśnienie techniczne do bezpłatnego przeglądania, pobierania i modyfikowania.

Tym, co spowodowało jego powszechną adaptację, jest sposób, w jaki stosuje widoczne rozumowanie, aby dojść do odpowiedzi.

Jak podkreśla Adam Clark Estes na łamach VOX.com: "ludzie uwielbiają oglądać, jak DeepSeek myśli na głos".

Siłą rzeczy więc obserwowanie tego, jak czatbot „myśli”, pomaga im bardziej mu zaufać i nauczyć się, jak lepiej go pobudzać. Z kolei OpenAI podjęło decyzję podczas wypuszczania o1 (które wykonuje podobne myślenie i rozumowanie przed wygenerowaniem odpowiedzi), aby nie pokazywać "procesu myślowego".

Clark Estes podkreśla, że może to wynikać z kilku powodów: "Po pierwsze, jest to tajemnica handlowa (…) Ale proces myślowy robi coś podobnego dla typowych użytkowników, co interfejs czatu. Sprawia, że AI jest bardziej bezpośrednia, dostępniejsza, bardziej interaktywna i mniej myląca. To nie jest duża różnica w podstawowym produkcie, ale jest to ogromna różnica w tym, jak bardzo ludzie są skłonni korzystać z produktu".

Ta otwartość sprawia, że DeepSeek jest dobrodziejstwem dla amerykańskich start-upów i badaczy – i jeszcze większym zagrożeniem dla czołowych amerykańskich firm, a także interesów bezpieczeństwa narodowego rządu.

Siłą rzeczy każdy może "zrobić" DeepSeek po swojemu. I, co tutaj jest ciekawostką, jeśli lokalizacją DeepSeek jest na przykład Polska, to możemy zapytać model o sprawy, które w Chinach są objęte cenzurą, takie jak 4 czerwca 1989 roku czy kwestię państwowości Tajwanu. Oczywiście na ten moment nie da się wykluczyć zagrożenia cyberbezpieczeństwa, ale założenie open source wydaje się "uczciwe".

Jeśli chińska AI zachowa swoją przejrzystość i dostępność, mimo pochodzenia z autorytarnego reżimu, którego obywatele nie mogą nawet swobodnie korzystać z sieci, będzie zmierzać w przeciwnym kierunku niż amerykański przemysł technologiczny.

Zachód pęka od marketingu.

– Strategia wielu biznesów, w tym tych skupionych wokół sztucznej inteligencji, opiera się na znanym haśle: Fake it till you make it (Udawaj, aż ci się uda – przyp. red.). Firmy robią szum wokół siebie, zbierają pieniądze, czasem coś z tego wyjdzie. A Chińczycy, a dokładniej twórcy DeepSeek, postawili na pracę po cichu i pochwalili się rezultatami – zauważa Sylwia Czubkowska i podkreśla, że przed epoką AI, czyli przed listopadem 2022 roku, prace nad AI odbywały się w laboratoriach, a dziś w dużej mierze dzieje się to w agencjach PR.

Chińczycy trzymają się mocno

Chiński wąż zdusił najmocniej zapał inwestorów. Dla wielu z nich wszystkie te ogromne centra danych, miliardy dolarów inwestycji, a nawet półbilionowe przedsięwzięcie joint venture w zakresie infrastruktury AI od OpenAI, Oracle'a i SoftBanku, które Trump niedawno ogłosił z Białego Domu, mogą wydawać się znacznie mniej istotne.

Demokratyzacja AI może w tym miejscu oznaczać ostudzenie zapędów bogaczy z Doliny Krzemowej. Na Olimpie AI trzeba zrobić miejsce dla gości ze Wschodu.

Według białej księgi opublikowanej w zeszłym roku przez China Academy of Information and Communications Technology, państwowy instytut badawczy, liczba dużych modeli językowych AI na świecie osiągnęła 1328, z czego aż 36 proc. pochodzi z Chin. To stawia Chiny na drugim miejscu pod względem wielkości wkładu w AI, za Stanami Zjednoczonymi.

Jednak pojawienie się DeepSeek zmienia naturę wyścigu zbrojeń AI między USA a Chinami.

Stosunkowo przejrzysta, publicznie dostępna wersja DeepSeek może oznaczać, że chińskie programy zamiast amerykańskich staną się globalnymi standardami technologicznymi dla AI – podobnie jak system operacyjny Linux z otwartym kodem źródłowym jest obecnie standardem dla głównych serwerów internetowych i superkomputerów. Bycie demokratycznym – w sensie przyznawania władzy programistom i użytkownikom oprogramowania – jest właśnie tym, co sprawiło, że DeepSeek odniosło sukces.

– Mnie DeepSeek przypomina czasy, gdy komputery osobiste zaczynały wygryzać z rynku mainframe’y i superkomputery. Tam, gdzie liczył się zdrowy rozsądek i skuteczność, "mniejsi" i "tańsi" potrafili zrobić więcej, niż ktokolwiek się spodziewał. W świecie dużych modeli językowych do tej pory panowało przeświadczenie, że tylko potężne centra danych uruchomią najnowocześniejsze rozwiązania AI. Teraz pojawia się ktoś, kto pokazuje, że można inaczej: mniej mocy nie musi oznaczać mniejszych możliwości – podkreśla Jacek Gralak.

W ocenie eksperta daje to dużo swobody zespołom badawczym, start-upom i średnim przedsiębiorstwom.

– Mogą pójść w personalizację i rozwijać własne modele, zamiast korzystać z uniwersalnych czatbotów wielkich dostawców. Taka wolność to ogromny pozytyw zarówno dla rozwoju nauki, jak i konkurencji na rynku – wyjaśnia.

Podobnego zdania jest Dimitris Papailiopoulos, główny badacz w laboratorium badawczym AI Frontiers firmy Microsoft. W swoim wpisie na LinkedIn podkreślał, że tym, co najbardziej go zaskoczyło w R1, jest prostota inżynierii.

"DeepSeek dążył do uzyskania dokładnych odpowiedzi zamiast szczegółowo opisywać każdy logiczny krok, znacznie skracając czas obliczeń przy jednoczesnym zachowaniu wysokiego poziomu skuteczności" – wyjaśniał w poście.

Czy zatem to nowy element chińskiej ofensywy, nie tania technologia, lecz już coś na kształt softpower? Skoro programiści i duża część środowiska pokochali chiński open source, to w epoce AI będziemy mieli tutaj efekt hollywoodzki w sektorze nowych technologii?

Chociaż chińska AI wyrosła z innych potrzeb niż amerykańska, to jej wpływ może być fundamentalny.

– Główną siłą Chin jest produkcja, więc sztuczna inteligencja ma głównie służyć zwiększaniu produkcji. Czatbot jest raczej elementem tego myślenia – zauważa Leszek Ślazyk, politolog, publicysta, przedsiębiorca i twórca portalu www.chiny24.com.

Jak tłumaczy ekspert, DeepSeek może zrewolucjonizować globalną gospodarkę w takich sektorach, jak logistyka, produkcja czy ochrona zdrowia. Chiny mogą stać się kluczowym eksporterem technologii AI, co dodatkowo wzmocni ich pozycję w światowym handlu.

Specjalista podkreśla również, że pojawienie się DeepSeek było zaskoczeniem, ale wynikającym w dużej mierze z arogancji Zachodu.

– W zachodnim myśleniu dominuje pogląd, że Chińczycy potrafią tylko naśladować, a jak już tworzą, to wyłącznie narzędzia opresji wobec świata i swoich obywateli. A tu okazało się, że tworzą innowację i jeszcze ją demokratyzują – zauważa Ślazyk.

Zdaniem eksperta Zachód wciąż nie rozumie Chin.

– Ocenianie tego państwa, wyrosłego z konfucjańskiego ducha, z perspektywy naszego zachodniego rozumienia wartości jest błędem – zauważa.

Nowy wirus z Chin

Trzeba pamiętać, że sztuczna inteligencja jest postrzegana przez chińskie władze jako kluczowy element transformacji gospodarczej i wzmacniania pozycji kraju na światowej scenie.

– W 2014 roku rząd Chin ogłosił Narodowy Plan Rozwoju Sztucznej Inteligencji, którego celem jest uczynienie kraju globalnym liderem w tej dziedzinie do 2030 roku. Plan obejmuje inwestycje w badania i rozwój (R&D), rozbudowę centrów danych oraz infrastruktury do przetwarzania informacji, a także wspieranie talentów poprzez programy edukacyjne i rozwój innowacyjnych start-upów – zauważa Leszek Ślazyk.

DeepSeek to tylko przykład. Alibaba udostępnił pierwsze modele generatywnej sztucznej inteligencji już na początku 2023 roku, krótko po niespodziewanym, globalnym sukcesie eksperymentalnego ChatGPT OpenAI. Jednak Tongyi Qianwen nie zdobył zbyt dużego rozgłosu w zachodnim świecie, gdyż wszystkie jego integracje i zastosowania były obecne jedynie w produktach przeznaczonych na rynek chiński.

Teraz na rynek trafił także nowy produkt Qwen 2.5-Max. Można z niego skorzystać poprzez interfejs przeglądarkowy na stronie chat.qwenlm.ai, a koncern udostępnił także API dla twórców aplikacji.

Wiatr zmian wieje ze Wschodu. Dokładnie 5 lat temu, na początku 2020 roku, z Państwa Środka wyszedł na świat wirus, który zmienił bieg historii. Pół dekady później może dojść do kolejnego trzęsienia ziemi. I znów "winne" wszystkiemu będą Chiny. To one zmieniają myślenie o filozofii pracy nad sztuczną inteligencją.

Za DeepSeek stoi pokolenie młodych chińskich badaczy silnie utożsamiających się z kulturą open source, które rozumie korzyści z otwartości i elastyczności. Za amerykańską kulturą AI stoi kult pieniądza i potrzeba jak najszybszego zmonetyzowania produktu. Dlatego tam open szybko stało się close. Dodam, że za europejską AI stoi na razie strach i ślepa wiara w Zachód. No i regulacje, które konieczne i potrzebne, obecnie są jedynie murem dla "obcych" rozwiązań, a nie parasolem dla rozwoju.

Jak zauważa prof. Aleksandra Przegalińska związana z Akademią Leona Koźmińskiego i Campus AI, Europa jest w trudnym położeniu, ale chińska ofensywa to też szansa. Dla Europy i globalnego Południa.

– Mam intuicję, że model chiński może stać się popularniejszy zwłaszcza w państwach globalnego Południa. Dla mnie superciekawe jest, co z tego wyniknie dla innych graczy: dla firm, które myślą o budowaniu modeli specjalistycznych; dla tych, którzy już uciekają od generative AI w stronę physical AI; dla przysypiającej Europy, która badawczo ma wiele do zaoferowania w AI, ale tego dotąd nie kapitalizowała – podkreśla prof. Przegalińska.

Dziś już widać, że wśród użytkowników indywidualnych może pojawić się strategia korzystania z różnych modeli. Badaczka wskazuje na dane z raportu po generative Revolution Day, który mówi jasno, że OpenAI nie będzie drugim Google'em.

Konkurencja, także pod płaszczykiem politycznym, nie śpi. W ostatnich dniach stycznia włoski odpowiednik Urzędu Ochrony Danych Osobowych zdecydował o zablokowaniu dostępu do aplikacji chińskiego czatbota na terenie Włoch.

Dla Polski, na co wskazują cytowani w tekście eksperci, ale także szerzej środowisko związane z AI, pojawienie się konkurencji ze Wschodu to szansa.

– Rozwój sztucznej inteligencji to jeden z najważniejszych procesów technologicznych, jakie będziemy obserwować w trakcie naszego życia. Musimy przekonywać polskich specjalistów, aby pozostali w kraju, a także przyciągać talenty z sąsiednich państw. Powinniśmy wysłać jasny sygnał, że Polska jest sercem regionu środkowej i wschodniej Europy, jeśli chodzi o rozwój AI – podsumowuje Jarosław Królewski.

Prezes Synerise – firmy, która działa już w 150 krajach i ma globalne znaczenie – wyjaśnia, że kluczowa będzie tu współpraca między rządem, biznesem i organizacjami pozarządowymi, choć oddolne inicjatywy mogą znacząco przyspieszyć rozwój sztucznej inteligencji w Polsce. Podobnym głosem mówił prof. Piotr Sankowski w naszym wywiadzie na łamach magazynu Spider's Web+.

Pojawienie się DeepSeek przypomina czasy dziś wręcz prehistoryczne, czyli przeglądarkę Netscape firmy Mosaic z 1994 roku. Zapoczątkowało to zupełnie nową erę, przełomowy moment w rozwoju internetu.

Być może unikniemy powtórki z rozrywki, gdzie jedna firma zdominowała rynek wyszukiwarek. Jeśli taką zmianę przyniesie DeepSeek, to należy mu się, tutaj żart, pokojowa Nagroda Nobla. Na pewno bardziej zasłużona niż w przypadku innego giganta technologii, Elona Muska.

Przysłowie, a raczej przekleństwo, przypisywane niesłusznie Chinom, mówi: "obyś żył w ciekawych czasach". No to żyjemy. Od pojawienia się ChatGPT 3.5 w listopadzie 2022 roku minęło niewiele ponad dwa lata, przez te 26 miesięcy świat dynamicznie przyśpieszył. W tych ciekawych czasach "zajeździmy kobyłę historii" szybciej, niż nam się wydaje.

TEKST PRZYGOTOWALI