Nowa AI od OpenAI. Najlepsza w historii do złożonych zadań
GPT-4.1 która zapowiada znaczący postęp w dziedzinie sztucznej inteligencji. Nowe modele oferują przełomowe usprawnienia w dziedzinie programowania, przetwarzania dłuższych kontekstów oraz lepszego podążania za instrukcjami użytkownika.

OpenAI zaprezentowało trzy nowe modele dostępne poprzez API:
- GPT-4.1 - sztandarowy model z pełnymi możliwościami;
- GPT-4.1 mini - wersja zrównoważona pod względem wydajności i kosztów;
- GPT-4.1 nano - najszybsza i najtańsza wersja, zoptymalizowana do zadań czasu rzeczywistego.
Wszystkie trzy modele przewyższają swoich poprzedników, GPT-4o i GPT-4o mini, oferując znaczące usprawnienia w kluczowych obszarach. Co istotne, nowe modele są dostępne wyłącznie poprzez API OpenAI i nie zostały jeszcze zintegrowane z ChatGPT.
Czytaj też:
Kluczowe ulepszenia w nowych modelach
Jednym z najbardziej imponujących ulepszeń w rodzinie GPT-4.1 jest możliwość przetwarzania do 1 miliona tokenów kontekstu. To ogromna poprawa w porównaniu do poprzednich modeli, które obsługiwały maksymalnie 128 tysięcy tokenów. Dla zobrazowania tej skali - milion tokenów to odpowiednik ponad 8 kopii całego kodu źródłowego biblioteki React.
Co więcej GPT-4.1 nie tylko przetwarza większą ilość danych, ale także lepiej rozumie długi kontekst. W wewnętrznych testach OpenAI wszystkie modele z rodziny GPT-4.1 skutecznie odnajdywały istotne informacje niezależnie od ich położenia w obszernym kontekście, co jest kluczowe dla zastosowań w analizie prawnej, kodowaniu czy obsłudze klienta.
GPT-4.1 wykazuje wyjątkowe zdolności w zakresie programowania, osiągając 54,6 proc. w benchmarku SWE-bench Verified, co stanowi poprawę o 21,4 punktu procentowego w porównaniu do GPT-4o. Jest to szczególnie istotne w kontekście rozwoju agentów programistycznych, których celem jest automatyzacja złożonych zadań inżynierii oprogramowania.
Model generuje czystszy kod frontendowy, precyzyjnie identyfikuje niezbędne zmiany w istniejącym kodzie i konsekwentnie tworzy kod, który się kompiluje i działa prawidłowo. Wewnętrzne testy OpenAI wykazały znaczny spadek liczby niepotrzebnych edycji kodu - z 9 proc. w przypadku GPT-4o do zaledwie 2 proc. w GPT-4.1.
Zdolność do precyzyjnego wykonywania złożonych poleceń użytkownika została znacząco poprawiona w nowych modelach. GPT-4.1 osiąga 38,3 proc. w benchmarku Scale's MultiChallenge, co oznacza wzrost o 10,5 punktu procentowego w porównaniu do GPT-4o.
Modele lepiej radzą sobie z:
- Przestrzeganiem określonych formatów wyjściowych (XML, YAML);
- Respektowaniem instrukcji negatywnych (czego unikać);
- Wykonywaniem zadań w zadanej kolejności;
- Spełnianiem wymogów dotyczących struktury odpowiedzi.
Ile to kosztuje?
Koszty korzystania z nowych modeli wynoszą:
- GPT-4.1: 2 dol. za milion tokenów wejściowych i 8 dol. za milion tokenów wyjściowych;
- GPT-4.1 mini: 0,4 dol. za milion tokenów wejściowych i 1,60 dol. za milion tokenów wyjściowych;
- GPT-4.1 nano: 0,1 dol. za milion tokenów wejściowych i 0,4 dol. za milion tokenów wyjściowych.
Microsoft również ogłosił wprowadzenie nowych modeli GPT-4.1 do Azure OpenAI Service i GitHuba. Modele te zachowują te same możliwości API co rodzina GPT-4o, w tym wywoływanie narzędzi i generowanie ustrukturyzowanych danych wyjściowych.
OpenAI zapowiedziało, że wkrótce udostępni możliwość nadzorowanego fine-tuningu dla modeli GPT-4.1 i GPT-4.1 mini. Pozwoli to programistom na dostosowanie modeli do specyficznych potrzeb biznesowych, terminologii branżowej oraz przepływów pracy. Dostosowane modele będą zarządzane i wdrażane za pośrednictwem Azure AI Foundry, dając pełną kontrolę nad wersjonowaniem, bezpieczeństwem i skalowalnością.
Dzięki swoim ulepszonym możliwościom GPT-4.1 znajduje zastosowanie w wielu dziedzinach
Wprowadzenie rodziny GPT-4.1 stanowi znaczący krok naprzód w rozwoju modeli językowych i sztucznej inteligencji. Imponujące ulepszenia w obszarze obsługi długiego kontekstu, zdolności programistycznych i podążania za instrukcjami otwierają nowe możliwości dla programistów i firm korzystających z API OpenAI.