REKLAMA

Meta chwaliła się najlepszym czatbotem na rynku. Internet szybko to zweryfikował

Najnowsza premiera modelu AI Mety pokazuje, że nie można ufać słupkom i wykresom z wynikami z testów porównawczych.

Meta chwaliła się najlepszym czatbotem na rynku. Internet szybko to zweryfikował
REKLAMA

Kilka dni temu Meta zaprezentowała nowe duże modele językowe sztucznej inteligencji z rodziny Llama 4: mniejszy Scout oraz większy, Maverick. Premiera obyłaby się bez większego echa gdyby nie fakt, że Meta zadeklarowała, że Maverick w testach porównawczych wypada lepiej niż flagowe modele AI od Google i OpenAI.

Meta chciała pochwalić się swoim modelem AI. Z pokazu wyszedł skandal

REKLAMA

Zaskakujące wyniki Mavericka zostały opublikowane nie tylko w biurze prasowym Mety, ale i w topliście LMArena - testu, w którym ludzie oceniają treści wygenerowane przez różne modele AI. Wyniki były sensacyjne, bowiem nagle Meta z firmy, która tworzy "całkiem okej" modele, zyskała tytuł firmy z modelem ocenianym przez użytkowników lepiej niż 4o OpenAI i tylko trochę gorzej niż Gemini 2.5 Pro.

Deklarowana wydajność Mavericka nie uszła uwadze środowisku badaczy i inżynierów sztucznej inteligencji i uczenia maszynowego, którzy zaczęli szukać przyczyn ponadprzeciętnych wyników. Jak donosi serwis TechCrunch, po zagłębieniu się w materiały udostępnione przez Metę - w szczególności wykres na oficjalnej stronie Llama - badacze odkryli, że do testów porównawczych użyto wersji Mavericka specjalnie dostrojonej do celów konwersacyjnych. Wersji, która nie została powszechnie udostępniona przez Metę.

Z konwersacyjnego Mavericka w formie czatbota można skorzystać na LM Arena, podczas gdy otwartoźródłowego Mavericka udostępnionego przez Metę można pobrać na komputery i uruchomić lokalnie - o ile ma się wystarczająco dobry komputer. Internauci porównali obie wersje modelu poprzez wpisywanie tych samych poleceń i instrukcji tekstowych (promptów). Maverick w LMArena miał dawać im znacznie lepsze odpowiedzi.

Sprawa zainteresowała także samo LM Arena, którego administratorzy usunęli Mavericka udostępnionego bezpośrednio przez Metę, zastępując go otwartoźródłową wersją dostępną w internecie.

Stanowisko zajęła także Meta, której rzecznika Ashely Gabriel zadeklarowała, że koncern "eksperymentuje z różnymi typami specjalnie dostosowanych wariantów" modeli AI.

„Llama-4-Maverick-03-26-Experimental” to wersja zoptymalizowana pod kątem czatu, z którą eksperymentowaliśmy, a która działa również dobrze na LMArenie. Wydaliśmy teraz naszą wersję open source i zobaczymy, jak programiści dostosowują Llama 4 do własnych przypadków użycia. Z niecierpliwością czekamy na ich opinie"

Więcej na temat AI:

Zdjęcie główne: M_Yunus / Shutterstock

REKLAMA
Najnowsze
Aktualizacja: 2025-05-24T07:22:00+02:00
Aktualizacja: 2025-05-23T21:47:42+02:00
Aktualizacja: 2025-05-23T21:02:41+02:00
Aktualizacja: 2025-05-23T20:30:01+02:00
Aktualizacja: 2025-05-23T20:08:22+02:00
Aktualizacja: 2025-05-23T18:45:13+02:00
Aktualizacja: 2025-05-23T18:34:16+02:00
Aktualizacja: 2025-05-23T18:07:40+02:00
Aktualizacja: 2025-05-23T17:38:56+02:00
Aktualizacja: 2025-05-23T17:22:52+02:00
Aktualizacja: 2025-05-23T16:22:46+02:00
Aktualizacja: 2025-05-23T15:30:10+02:00
Aktualizacja: 2025-05-23T15:24:39+02:00
Aktualizacja: 2025-05-23T14:48:16+02:00
Aktualizacja: 2025-05-23T12:38:15+02:00
Aktualizacja: 2025-05-23T11:42:04+02:00
Aktualizacja: 2025-05-23T11:08:03+02:00
Aktualizacja: 2025-05-23T10:32:24+02:00
Aktualizacja: 2025-05-23T07:02:08+02:00
Aktualizacja: 2025-05-23T06:36:21+02:00
Aktualizacja: 2025-05-23T06:11:00+02:00
Aktualizacja: 2025-05-22T21:48:15+02:00
Aktualizacja: 2025-05-22T21:18:27+02:00
Aktualizacja: 2025-05-22T20:47:01+02:00
Aktualizacja: 2025-05-22T20:24:45+02:00
REKLAMA
REKLAMA
REKLAMA