Chiński DeepSeek już wygryza ChatGPT. Miliony użytkowników, serwery ledwo nadążają
Efekt nowości, niska cena, dostępność open-source i pełna otwartość dostawcy. OpenAI zapoczątkował rewolucję poprzez swoje modele GPT, o i DALL-E. Usługi amerykańskiej firmy są jednak bardzo drogie. Tymczasem chiński model jest śmiesznie tani, również w utrzymaniu.
High-Flyer Capital Management, założona w 2015 roku, dotychczas była mało znana w zachodniej branży informatycznej. Obecnie jednak firma zyskuje na rozgłosie dzięki wydaniu Dużego Modelu Językowego DeepSeek, który stanowi bezpośrednią konkurencję dla modelu OpenAI o1. Podobnie jak o1 i w przeciwieństwie do GPT, DeepSeek analizuje i przetwarza własne odpowiedzi, minimalizując problem halucynacji i umożliwiając realizację złożonych, wieloetapowych zadań i analiz.
DeepSeek nie tylko dorównuje klasą i zastosowaniem konkurencyjnym modelom, ale również charakteryzuje się bardzo wysoką jakością, co potwierdziły pierwsze testy. W większości branżowych i naukowych benchmarków przewyższa OpenAI o1. Choć przewaga jest niewielka i na pierwszy rzut oka trudno mówić o zdecydowanym zwycięstwie, powierzchowne spojrzenie byłoby mylące, gdyż kluczowe są inne aspekty tego modelu.
Czytaj też:
DeepSeek przeciążony. Ktoś mógłby pomyśleć, że powiązana z nim chmura jest słaba. Sęk w tym, że aplikacja już jest najpopularniejszą darmową aplikacją w całym amerykańskim App Store
Aktualnie DeepSeek działa na modelu DeepSeek-V3. Do jego wyszkolenia użyto taptem 2048 układów Nvidia H800 - według deklaracji prezesa Lianga Wenfenga - i jest modelem z 671 miliardami parametrów. Wygląda na to, że amerykańskie sankcje dotyczące zakazu eksportu zaawansowanych układów scalonych do szkolenia AI tylko zmotywowały chińskie korporacje informatyczne do stworzenia wysoce energetycznie i kosztowo efektywnych modeli.
DeepSeek technicznie nie jest lepszy od niczego, co ma w swojej ofercie OpenAI. Tyle że amerykańska firma buduje swoje technologie paląc w piecu setkami milionów dolarów. Nietrudno jest sobie wyobrazić, że część kosztów przerzucana będzie na klientów. Atutem DeepSeek jest cena niższa niemal o rząd wielkości. Choć mimo otwartości modelu eksperci sugerują ostrożność motywowaną polityką informacyjną (cenzurą i przekłamywaniem historycznych wydarzeń) Chińskiej Republiki Ludowo-Demokratycznej.
Otwarty, bardzo tani i wszech dostępny. Choć nie chce poruszać kontrowersyjnych dla Chin tematów
Według deklaracji twórców, koszt wyszkolenia DeepSeek wyniósł zaledwie 5 mln dol., co wydaje się kwotą wręcz śmieszną w porównaniu z miliardami inwestowanymi przez OpenAI. Ponadto DeepSeek jest w pełni darmowy i dostępny z opublikowanym kodem źródłowym, podczas gdy OpenAI o1 to model zamknięty i własnościowy, oferowany w ramach płatnych subskrypcji ChatGPT Plus lub ChatGPT Pro.
Już teraz DeepSee jest najczęściej wykorzystywanym modelem w chmurze Hugging Face, a jego otwartość zachęciła specjalistów do eksperymentowania. W krótkim czasie od premiery pojawiły się warianty wyspecjalizowane w konkretnych zadaniach, takich jak optymalizacja pod urządzenia mobilne czy specjalizacja w określonej dziedzinie wiedzy.
DeepSeek można samodzielnie budować lub korzystać z dostępnego API dla modeli hostowanych w chmurze, którego cennik jest średnio o 90 proc. niższy od cen API OpenAI. Dodatkowo DeepSeek potrafi bez żadnych modyfikacji i wtyczek uzupełniać swoje informacje danymi z wyszukiwarek internetowych.