Twórcy ChataGPT mają problem. Nadchodzi nowa generacja DeepSeeka
Pierwsza dobra nieamerykańska AI podbija świat przebojem z uwagi na swoją wysoką efektywność kosztową. DeepSeek R1 jest niezestawialnie tańszy w utrzymaniu i szkoleniu od dowolnego amerykańskiego modelu, zapewniając podobną lub niewiele niższą jakość. DeepSeek R2 ma być wyłącznie lepszy.

Chińska firma DeepSeek, która wstrząsnęła branżą AI wprowadzeniem modelu R1, przyspiesza prace nad następcą - modelem R2. Pierwotnie planowana na maj 2025 premiera została przyśpieszona, co wynika z chęci utrzymania przewagi konkurencyjnej nad OpenAI, Google’em i Anthropic.
Nowy model ma zaoferować rewolucyjne możliwości w zakresie rozumowania wielojęzycznego, zaawansowanej generacji kodu oraz bezprecedensową efektywność kosztową. Według analityków R2 może stać się kamieniem milowym w wyścigu o dominację w AI, zwłaszcza w kontekście zaostrzającej się rywalizacji technologicznej między Chinami a Stanami Zjednoczonymi.
To też jest ciekawe:
Technologiczny skok modelu DeepSeek R2
W przeciwieństwie do R1, który operował głównie w języku angielskim, R2 rozumie kontekst kulturowy i niuanse 27 języków, w tym polskiego. Testy beta pokazują 40 proc. poprawę w zadaniach tłumaczeniowych w porównaniu z GPT-4.5. Nowy mechanizm uwagi pozwala równolegle przetwarzać do 64 wątków kontekstowych, co przekłada się na trzykrotny wzrost prędkości inferencji względem R1.
Według dokumentacji technicznej R2 wykorzystuje 1,2 tryliona parametrów, z czego tylko 145 mld jest aktywowanych dla typowych zadań, utrzymując koszt operacyjny na poziomie 0,003 dol. na 1000 tokenów.
Podstawą sukcesu DeepSeek jest niestandardowe podejście do infrastruktury obliczeniowej. Firma wykorzystuje klastry superkomputerowe Fire-Flyer II, składające się z 10 tys. układów Nvidia A100, które - w połączeniu z autorskimi algorytmami kwantyzacji - osiągają 92 proc. wydajności najnowszych chipów H100 przy 30 proc. kosztów. W praktyce oznacza to, że trening R2 wymagał zużycia 28 GWh energii, podczas gdy porównywalny model OpenAI - ponad 150 GWh.
Co na to Stany Zjednoczone i Europa?
Przyspieszenie prac nad R2 zbiegło się w czasie z ogłoszeniem nowych restrykcji Stanów Zjednoczonych dotyczących eksportu układów AI do Chin. Pomimo tych ograniczeń DeepSeek utrzymuje, że ich modyfikacje sprzętowe pozwalają osiągać 85 proc. wydajności zachodnich systemów przy użyciu chipów starszej generacji. Eksperci ostrzegają, że sukces R2 może wymusić przyspieszenie prac nad europejskimi i amerykańskimi odpowiednikami, co przełoży się na wzrost inwestycji w AI o 25-40 proc. do 2026 r.
W załączonej powyżej demonstracji R2 w połączeniu z frameworkiem Janus Pro wygenerował w pełni funkcjonalną aplikację kalkulatora z interfejsem Material Design w 12 minut.
W świetle zapowiedzi DeepSeek, do końca 2025 r. planowane są:
- Integracja R2 z systemami ERP typu SAP i Oracle.
- Wersja specjalizowana dla sektora finansowego z obsługą modeli risk management.
- Narzędzia do real-time analytics z opóźnieniem poniżej 100 ms.
- Pełna kompatybilność z europejskim rozporządzeniem AI Act.
Eksperci przewidują, że do 2026 r. 35 proc. globalnych projektów AI będzie wykorzystywało technologie pochodzące od DeepSeek, co radykalnie zmieni układ sił w branży.
Przyspieszona premiera DeepSeek R2 oznacza punkt zwrotny w rozwoju sztucznej inteligencji. Połączenie bezprecedensowej efektywności kosztowej, zaawansowanych możliwości wielojęzycznych i rewolucyjnych architektur obliczeniowych stawia chińską firmę w roli głównego disruptora rynku.
Podczas gdy zachodnie korporacje koncentrują się na wyścigu parametrów, DeepSeek redefiniuje same podstawy ekonomii AI, oferując wydajność porównywalną z liderami rynku przy ułamku ich kosztów. Sukces R2 może przyspieszyć procesy decentralizacji w branży AI, tworząc nowe możliwości dla mniejszych graczy i wymuszając zmianę strategii technologicznych na poziomie globalnym. Oby tylko na tym skorzystała również Europa, a nie tylko same Chiny.
Zdjęcie otwierające: Primakov / Shutterstock