REKLAMA

Meta chwaliła się najlepszym czatbotem na rynku. Internet szybko to zweryfikował

Najnowsza premiera modelu AI Mety pokazuje, że nie można ufać słupkom i wykresom z wynikami z testów porównawczych.

Malwina Kuśmierek

09.04.2025 13:38

Meta chwaliła się najlepszym czatbotem na rynku. Internet szybko to zweryfikował

REKLAMA

Kilka dni temu Meta zaprezentowała nowe duże modele językowe sztucznej inteligencji z rodziny Llama 4: mniejszy Scout oraz większy, Maverick. Premiera obyłaby się bez większego echa gdyby nie fakt, że Meta zadeklarowała, że Maverick w testach porównawczych wypada lepiej niż flagowe modele AI od Google i OpenAI.

REKLAMA

Meta chciała pochwalić się swoim modelem AI. Z pokazu wyszedł skandal

Zaskakujące wyniki Mavericka zostały opublikowane nie tylko w biurze prasowym Mety, ale i w topliście LMArena - testu, w którym ludzie oceniają treści wygenerowane przez różne modele AI. Wyniki były sensacyjne, bowiem nagle Meta z firmy, która tworzy "całkiem okej" modele, zyskała tytuł firmy z modelem ocenianym przez użytkowników lepiej niż 4o OpenAI i tylko trochę gorzej niż Gemini 2.5 Pro.

Deklarowana wydajność Mavericka nie uszła uwadze środowisku badaczy i inżynierów sztucznej inteligencji i uczenia maszynowego, którzy zaczęli szukać przyczyn ponadprzeciętnych wyników. Jak donosi serwis TechCrunch, po zagłębieniu się w materiały udostępnione przez Metę - w szczególności wykres na oficjalnej stronie Llama - badacze odkryli, że do testów porównawczych użyto wersji Mavericka specjalnie dostrojonej do celów konwersacyjnych. Wersji, która nie została powszechnie udostępniona przez Metę.

Z konwersacyjnego Mavericka w formie czatbota można skorzystać na LM Arena, podczas gdy otwartoźródłowego Mavericka udostępnionego przez Metę można pobrać na komputery i uruchomić lokalnie - o ile ma się wystarczająco dobry komputer. Internauci porównali obie wersje modelu poprzez wpisywanie tych samych poleceń i instrukcji tekstowych (promptów). Maverick w LMArena miał dawać im znacznie lepsze odpowiedzi.

Sprawa zainteresowała także samo LM Arena, którego administratorzy usunęli Mavericka udostępnionego bezpośrednio przez Metę, zastępując go otwartoźródłową wersją dostępną w internecie.

Stanowisko zajęła także Meta, której rzecznika Ashely Gabriel zadeklarowała, że koncern "eksperymentuje z różnymi typami specjalnie dostosowanych wariantów" modeli AI.

„Llama-4-Maverick-03-26-Experimental” to wersja zoptymalizowana pod kątem czatu, z którą eksperymentowaliśmy, a która działa również dobrze na LMArenie. Wydaliśmy teraz naszą wersję open source i zobaczymy, jak programiści dostosowują Llama 4 do własnych przypadków użycia. Z niecierpliwością czekamy na ich opinie"

Więcej na temat AI:

REKLAMA

Zdjęcie główne: M_Yunus / Shutterstock

REKLAMA

Malwina Kuśmierek

09.04.2025 13:38

Tagi: Meta Sztuczna inteligencja (AI)

Najnowsze

11:58

Kometa 3I/Atlas zdradza kolejne tajemnice. "Zostaliśmy zbici z tropu"

Aktualizacja: 2025-11-26T11:58:44+01:00

11:08

Black Friday 2025: najlepsze promocje na elektronikę. Wybraliśmy hity

Aktualizacja: 2025-11-26T11:08:48+01:00

10:41

ChatGPT doprowadził nastolatka do tragedii. OpenAI: to wina chłopaka

Aktualizacja: 2025-11-26T10:41:36+01:00

10:16

POCO zaszalało. Nowe telefony marki nie biorą jeńców

Aktualizacja: 2025-11-26T10:16:46+01:00

9:02

Szukasz tabletu graficznego? To już przestań, bo XPPen przygotował niespodzianki

Aktualizacja: 2025-11-26T09:02:33+01:00

8:37

Chatboty przejmują zakupy. Cały proces chcą wygryźć do zera

Aktualizacja: 2025-11-26T08:37:34+01:00

7:51

Google wciska nowość w pasek wyszukiwania. Dziękujemy, nie prosiliśmy

Aktualizacja: 2025-11-26T07:51:27+01:00

6:45

Gry na GOG do 20 zł – najlepsze klasyki za najmniejsze pieniądze

Aktualizacja: 2025-11-26T06:45:00+01:00

6:34

Satelity widzą coś niepokojącego na Antarktydzie. Kontynent się zmienia

Aktualizacja: 2025-11-26T06:34:00+01:00

6:23

Nowe Rosomaki już polują. Zdalne wieże to topowa polska technologia

Aktualizacja: 2025-11-26T06:23:00+01:00

6:12

Francuzi prowadzą Shein na gilotynę. To może być nowa rewolucja

Aktualizacja: 2025-11-26T06:12:00+01:00

6:01

Kopał basen, wykopał fortunę. W Polsce zabrałoby mu ją państwo

Aktualizacja: 2025-11-26T06:01:00+01:00

20:57

Wciskasz 4 klawisze i masz wirusa. Sprytny atak udaje Windowsa

Aktualizacja: 2025-11-25T20:57:39+01:00

20:47

Płacisz telefonem Samsunga, masz słuchawki za darmo – jest okazja

Aktualizacja: 2025-11-25T20:47:56+01:00

20:34

Nie oglądamy już telewizji? Dobre sobie, w Polsce VoD to plankton

Aktualizacja: 2025-11-25T20:34:42+01:00

19:32

Chrome zwiększył prywatność użytkowników. To aż podejrzane

Aktualizacja: 2025-11-25T19:32:38+01:00

19:19

iPhone Air robi zdjęcia jak czteroletni telefon. Wstyd

Aktualizacja: 2025-11-25T19:19:31+01:00

18:29

Eksplorator plików Windows działa za wolno. Microsoft ma na to sposób

Aktualizacja: 2025-11-25T18:29:27+01:00

18:06

Aluminium OS to nowy Android na komputer od Google. Będzie moc

Aktualizacja: 2025-11-25T18:06:12+01:00

17:23

Spotify ma podrożeć. Wszyscy dokładamy się do melomanów

Aktualizacja: 2025-11-25T17:23:01+01:00

17:12

Steam Deck kilkaset zł taniej, gracze tłumnie korzystają z okazji

Aktualizacja: 2025-11-25T17:12:52+01:00

16:07

Iryda+ zapoluje na ruskie drony. Polski dron obroni nasze osiedla

Aktualizacja: 2025-11-25T16:07:18+01:00

15:46

Słuchawki w ekstra cenach na Black Friday. Trudno się powstrzymać

Aktualizacja: 2025-11-25T15:46:22+01:00

15:42

Co z Trump Phone? Szukam smartfona od pomarańczowego

Aktualizacja: 2025-11-25T15:42:55+01:00

15:21

64 GB RAM albo PS5, wybierz jedno. Budowanie PC to koszmar

Aktualizacja: 2025-11-25T15:21:30+01:00

15:16

MSI Cyborg 15 waży 2 kg i uciągnie wszystko. Imponujący prezent dla gracza

Aktualizacja: 2025-11-25T15:16:06+01:00

15:00

Budujemy lotniczy bastion straży granicznej. Dla "czeskich oczu"

Aktualizacja: 2025-11-25T15:00:55+01:00

14:18

Telewizory w potężnych promocjach. Te przekonały mnie najbardziej

Aktualizacja: 2025-11-25T14:18:15+01:00

13:38

Black Friday: najlepsze promocje na smartwatche i smartbandy. Portfel gotowy?

Aktualizacja: 2025-11-25T13:38:22+01:00

13:31

Smartfon i stacjonarka w jednym. Maxcom MS601- test smartfona ze stacją

Aktualizacja: 2025-11-25T13:31:34+01:00

13:23

W Polsce kupisz humanoidalnego robota. Takiej oferty jeszcze nie było

Aktualizacja: 2025-11-25T13:23:17+01:00

12:00

Najlepsze promocje na gry Black Friday 2025. To się opłaca

Aktualizacja: 2025-11-25T12:00:20+01:00

11:49

Chodniki im już nie wystarczą. Hulajnogi anektują pociągi i tramwaje

Aktualizacja: 2025-11-25T11:49:25+01:00

11:40

Nowy iPhone 17 w świetnych cenach. Ruszyły grube promocje

Aktualizacja: 2025-11-25T11:40:50+01:00

11:07

Pierwsza misja ratunkowa na chińską stację kosmiczną. Akcja jak z filmu

Aktualizacja: 2025-11-25T11:07:10+01:00

10:36

Tim Cook nie idzie na emeryturę? Hejterzy w ryk, a miłośnicy klaszczą w dłonie

Aktualizacja: 2025-11-25T10:36:31+01:00

9:56

Black Friday: LEGO przecenione jak nigdy. Ja już zapełniam koszyk

Aktualizacja: 2025-11-25T09:56:41+01:00

9:39

UOKiK bierze się za Apple'a. Mówi, że firma ściemnia i udaje, że chroni klientów

Aktualizacja: 2025-11-25T09:39:31+01:00

9:36

Amazon odpalił promocje na Kindle i inne sprzęty przed Black Friday. Co bierzesz?

Aktualizacja: 2025-11-25T09:36:04+01:00

9:22

Tarcza drążąca tunel stoi, a ściany pękają. Jest tak źle, że Łódź prosi o pomoc

Aktualizacja: 2025-11-25T09:22:17+01:00

REKLAMA

REKLAMA