Chiński DeepSeek bije wszystkie modele OpenAI. Zachód ma wielki problem
Jeszcze nie tak dawno temu mało kto słyszał o znajdującej się w Hongkongu firmie High-Flyer Capital Management. Teraz jest na ustach niemal wszystkich w Krzemowej Dolinie. Jej model DeepSeek zapewnia lepsze rezultaty od modelu OpenAI o1 - generując przy tym istotnie niższe koszty.
High-Flyer Capital Management została założona w 2015 r. i do tej pory jej mało chwytliwa nazwa pozostawała obca zachodniej branży informatycznej - co właśnie się zmienia. Duży Model Językowy DeepSeek-R1, który właśnie został zaprezentowany i wydany, to bezpośrednia konkurencja dla modelu OpenAI o1. Podobnie jak o i w przeciwieństwie do GPT, DeepSeek-R1 analizuje i przetwarza własne odpowiedzi, redukując do minimum problem halucynacji i pozwalając na realizowanie złożonych, wieloetapowych zadań i analiz.
DeepSeek-R1 to nie tylko model podobnej klasy i zastosowania, ale również jest modelem bardzo wysokiej jakości - co już wykazały pierwsze testy. W większości branżowych lub naukowych benchmarków wygrywa z OpenAI o1. Nieznacznie, więc powierzchownie patrząc trudno mówić o jakimkolwiek nokaucie. Powerzchowne spojrzenie byłoby jednak w tym przypadku błędne.
Czytaj też:
Miliony zamiast miliardów. DeepSeek jest kilkukrotnie tańszy w budowie i utrzymaniu
Według deklaracji twórców, koszt wyszkolenia modelu DeepSeek-R1 to raptem 5 mln dol., co wydaje się kwotą wręcz śmieszną zestawiając ją z miliardami inwestowanymi przez OpenAI. Jakby tego było mało, DeepSeek-R1 jest… w pełni darmowy i z opublikowanym kodem źródłowym. OpenAI o1 to model zamknięty i własnościowy, dostępny w ramach płatnego dostępu ChatGPT Plus lub ChatGPT Pro. Już teraz jest najczęściej konsumowanym modelem w chmurze Hugging Face.
Co więcej, jego open-source’owa natura zachęciła specjalistów do eksperymentowania. Już dziś, w bardzo niedługim czasie od premiery, pojawiły się do pobrania jego wariacje, wyspecjalizowane do konkretnych zadań, takich jak optymalizacja pod urządzenia mobilne czy specjalizacja w konkretnej dziedzinie wiedzy. DeepSeeka można własnoręcznie budować lub korzystać z dostępnego DeepSeek API dla modeli hostowanych w chmurze - cennik jest średnio o 90 proc. atrakcyjniejszy kwotowo od cen API od OpenAI. DeepSeek-R1 potrafi przy tym jeszcze bez żadnej modyfikacji i wtyczek uzupełniać swoje informacje z danych z wyszukiwarek internetowych.
Liderzy branży są pod niemałym wrażeniem, czemu zdążyli już dać wyraz w mediach społecznościowych. Jeden z wysokopostawionych pracowników Nvidii pozwolił sobie wręcz na zdumiewająco szczery komentarz, w którym zauważył ironię losu, że chińska firma realizuje misję zapewnienia otwartej i szerokodostępnej AI ludzkości - tę samą misję, którą miało realizować amerykańskie OpenAI.
To nie jedyna chińska firma, która pracuje nad tanimi modelami AI, które funkcjonalnie nie ustępują absurdalnie drogim amerykańskim odpowiednikom (i otwartemu modelowi Llama od Mety). ByteDance, właściciel TikToka, pochwalił się niedawno modelem Doubao-1.5-pro, który w benchmarkach osiąga podobne wyniki do GPT-4 generując przy tym 2 proc. (sic!) kosztów modelu OpenAI. Przedstawiciele OpenAI byli już proszeni o komentarz w związku z triumfem chińskich informatyków - jak nietrudno się domyślić, na razie odmawiają komentarza.