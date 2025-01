Aktualnie DeepSeek działa na modelu DeepSeek-V3. Do jego wyszkolenia użyto taptem 2048 układów Nvidia H800 - według deklaracji prezesa Lianga Wenfenga - i jest modelem z 671 miliardami parametrów. Wygląda na to, że amerykańskie sankcje dotyczące zakazu eksportu zaawansowanych układów scalonych do szkolenia AI tylko zmotywowały chińskie korporacje informatyczne do stworzenia wysoce energetycznie i kosztowo efektywnych modeli.