Najwidoczniej ogłoszony przez Sama Altmana "kod czerwony" zaczął przeradzać się w czyny. Bo niecały miesiąc po premierze GPT-5.1, OpenAI raczy świat modelem GPT-5.2, który ma ratować honor ChataGPT po sukcesie Gemini 3.



Najnowsza seria modeli i ma być - jak zapewnia firma - najbardziej kompetentną propozycją do pracy zawodowej. W tym programowania, analizy dokumentów, tworzenia prezentacji czy wieloetapowych projektów.

Najnowszy GPT-5.2 jest jak plaster na krwawiącą ranę. W sumie to całkiem ładny plaster

GPT-5.2 to największy dotąd skok w ramach piątej generacji modeli. Warianty Thinking i Pro są zorientowane na generowanie "rozwiniętych sekwencji rozumowania", podczas gdy Instant obsługuje szybsze zadania. Wszystkie trzy korzystają z okna kontekstowego sięgającego 400 tys. tokenów - wysyłane im prompty (instrukcje tekstowe) mogą oprócz długich wiadomości zawierać także liczne dokumenty. Zakktualizowano także zbiór wiedzy o świecie - GPT-5.2 wie o wszystkim co działo się na świecie przed 31 sierpnia 2025 r. W API GPT-5.2 kosztuje 1,75 dol. za milion tokenów wejściowych, czyli o 40 proc. więcej niż GPT-5.1.

OpenAI mocno akcentuje wydajność nowej wersji. Firma deklaruje, że GPT-5.2 Thinking wyręcza lub dorównuje "ludzkim profesjonalistom" w 70,9 proc. zadań w benchmarku GDPval obejmującym zadania typowe dla 44 zawodów - od programistów i prawników po dyplomowane pielęgniarki i inżynierów mechaników. To istotny wzrost względem Gemini 3 Pro, ocenionego w tym samym benchmarku na 53,3 proc. W testach inżynierii oprogramowania SWE-Bench Pro model osiągnął 55,6 proc., wyprzedzając zarówno Geminiego 3 Pro, jak i Claude’a Opus 4.5. W zadaniach naukowych GPQA Diamond uzyskał 92,4 proc., minimalnie wyżej niż Google. Jak relacjonuje serwis VentureBeat, podczas spotkania z mediami OpenAI chętnie chwaliło się wyższością GPT-5.2 nad Gemini, ale na swojej stronie nie zamieściło żadnych bezpośrednich porównań z Gemini 3. Zamiast tego firma skupiła się na narracji "ulepszeń względem GPT-5.1".

Tabela z materiałów prasowych z benchmarkami GPT-5.2 - w oficjalnym poście na blogu OpenAI znajdziemy tylko dwie pierwsze kolumny; źródło: VentureBeat

Równocześnie model ma generować o 38 proc. mniej konfabulacji niż GPT-5.1. Mimo to firma nie obiecuje cudów: Altman przyznał, że GPT-5.2 wciąż nie umie np. tworzyć w pełni dopracowanych plików bez nadzoru człowieka.

W praktyce 5.2 ma być przede wszystkim narzędziem pracy. OpenAI twierdzi, że użytkownicy biznesowi są w stanie zaoszczędzić nawet 40-60 minut dziennie dzięki usprawnieniom wprowadzonym do nowej iteracji modelu. Potwierdzać mają to doświadczenia pracowników Shopify czy Zoom - firm, którym OpenAI udostępniło GPT-5.2 w ramach zamkniętego testu. OpenAI podkreśla też, że strategicznie była gotowa na tę premierę od dawna - choć decyzja o jej tempie i terminie niewątpliwie została ukształtowana przez agresywny ruch Google'a.

Ostateczna ocena GPT-5.2 będzie jednak zależeć od niezależnych testów. Historia benchmarków pokazała już, że firmy technologiczne potrafią przedstawić wyniki w najkorzystniejszym dla siebie świetle, a nauka mierzenia zdolności AI wciąż nie nadąża za marketingiem. Na razie nowy model wygląda na stosunkowo skromną aktualizację, która ma uspokoić inwestorów i zatrzymać użytkowników - przynajmniej do kolejnego ruchu Google'a.

Malwina Kuśmierek 12.12.2025 09:46

