Premiera GPT-5.2. Nowa seria modeli do zadań specjalnych

OpenAI udostępnia serię GPT-5.2, stworzoną z myślą o profesjonalnej pracy. Według deklaracji twórców, nowe modele mają lepiej radzić sobie z kodowaniem, analizą danych i długimi dokumentami, popełniając przy tym znacznie mniej błędów.

Karolina Ceroń

Miesiąc po premierze GPT-5.1, OpenAI wprowadza na rynek serię modeli GPT-5.2 (Instant, Thinking oraz Pro), którą określa mianem najbardziej zaawansowanego rozwiązania do pracy zawodowej. Twórcy narzędzia podkreślają odejście od prostych konwersacji na rzecz wykonywania złożonych, wieloetapowych zadań. Nowe modele zaprojektowano tak, aby generowały konkretną wartość ekonomiczną – od tworzenia zaawansowanych arkuszy kalkulacyjnych, przez pisanie kodu, aż po precyzyjną analizę obrazów i długich tekstów.

Wydajność na poziomie eksperckim

W testach GDPval, obejmujących zadania typowe dla 44 różnych zawodów (reprezentujących kluczowe sektory gospodarki USA), wariant GPT-5.2 Thinking osiągnął wyniki przewyższające lub dorównujące ludzkim ekspertom w 70,9% przypadków. Dla porównania – poprzednia wersja (GPT-5) osiągała ten pułap jedynie w 38,8% prób.

Zadania testowe polegały na przygotowaniu konkretnych produktów pracy, takich jak prezentacje sprzedażowe, harmonogramy dyżurów w placówkach medycznych czy schematy produkcyjne. Sędziowie oceniający wyniki zwrócili uwagę na wysoki poziom merytoryczny i estetyczny generowanych dokumentów, które często wymagały jedynie drobnych korekt. Co istotne, model wykonywał te zadania ponad 11 razy szybciej niż specjaliści, przy koszcie stanowiącym mniej niż 1% standardowej stawki rynkowej za taką pracę (szacunki oparte na danych historycznych).

W wewnętrznych testach obejmujących zadania analityczne z zakresu bankowości inwestycyjnej – takie jak modelowanie finansowe czy formatowanie raportów dla spółek z listy Fortune 500 – skuteczność modelu wzrosła z 59,1% (GPT-5.1) do 68,4%.

Programowanie i praca z obrazem

GPT-5.2 Thinking wyznacza nowy standard w inżynierii oprogramowania. W rygorystycznym teście SWE-Bench Pro, który sprawdza umiejętność rozwiązywania rzeczywistych problemów programistycznych w czterech językach, model osiągnął wynik 55,6%. W wersji SWE-bench Verified wynik ten wyniósł aż 80%.

Osoby testujące model we wczesnym dostępie (w tym zespoły z firm takich jak Cognition czy JetBrains) wskazują na znaczącą poprawę w zakresie front-end developmentu oraz tworzenia interfejsów użytkownika, w tym elementów 3D. Model potrafi stworzyć kompletną, interaktywną aplikację (np. symulację fal morskich czy grę) na podstawie jednego, precyzyjnego polecenia („promptu”).

Poprawie uległy również zdolności wizualne. Błędy w interpretacji wykresów naukowych i interfejsów oprogramowania zredukowano o niemal połowę. Model lepiej rozumie relacje przestrzenne, co pozwala mu precyzyjniej identyfikować elementy na zrzutach ekranu, schematach technicznych czy zdjęciach sprzętu elektronicznego.

Wiarygodność i długi kontekst

Jednym z kluczowych aspektów dla zastosowań profesjonalnych jest ograniczenie tzw. halucynacji. W porównaniu do wersji 5.1, GPT-5.2 Thinking popełnia o 30% mniej błędów w odpowiedziach (dane oparte na zanonimizowanych zapytaniach z ChatGPT). Choć model nadal nie jest nieomylny, wyższa precyzja czyni go bezpieczniejszym narzędziem w procesach decyzyjnych.

Znaczący postęp odnotowano także w obsłudze długiego kontekstu. W teście OpenAI MRCRv2, sprawdzającym umiejętność łączenia faktów rozproszonych w obszernych dokumentach, model osiągnął niemal 100-procentową skuteczność w wariancie do 256 tysięcy tokenów. Oznacza to, że GPT-5.2 może efektywnie analizować wielostronicowe umowy, raporty badawcze czy transkrypcje, zachowując spójność i nie gubiąc wątku.

Dostępność i warianty modelu

Nowe modele są wdrażane stopniowo, począwszy od płatnych planów (Plus, Pro, Business, Enterprise). Użytkownicy otrzymują dostęp do trzech wariantów:

GPT-5.2 Instant: Model zoptymalizowany pod kątem szybkości, sprawdzający się w codziennych zadaniach, pisaniu technicznym i tłumaczeniach.
GPT-5.2 Thinking: Przeznaczony do głębszej pracy analitycznej, planowania i rozwiązywania złożonych problemów logicznych oraz matematycznych.
GPT-5.2 Pro: Najbardziej zaawansowana wersja, rekomendowana do najtrudniejszych pytań, gdzie czas oczekiwania jest drugorzędny wobec jakości odpowiedzi.

W przypadku API ceny ustalono na poziomie 1,75 USD za milion tokenów wejściowych i 14 USD za milion tokenów wyjściowych (dla modelu podstawowego). Mimo wyższej ceny jednostkowej w porównaniu do poprzedników, wyższa efektywność modelu może w ostatecznym rozrachunku obniżyć koszt wykonania zadania, dzięki mniejszej liczbie koniecznych poprawek.

Karolina Ceroń

Współtwórczyni newslettera AI Flash, studentka psychologii i pasjonatka sztucznej inteligencji. Interesuję się wpływem nowych technologii na człowieka, a w wolnych chwilach eksperymentuję z generatywną grafiką w Midjourney.

AI, chatgpt, genai, openai

Premiera GPT-5.2. Nowa seria modeli do zadań specjalnych

Mistral 3: Premiera nowej generacji modeli open-weight

Claude Opus 4.5 : nowa jakość w kodowaniu?

Nano Banana Pro: Precyzja, tekst i weryfikacja

Grok łagodnieje? Nowy model od xAI

Premiera GPT-5.2. Nowa seria modeli do zadań specjalnych

Wydajność na poziomie eksperckim

Programowanie i praca z obrazem

Wiarygodność i długi kontekst

Dostępność i warianty modelu

Share

Share

You might be interested in

Mistral 3: Premiera nowej generacji modeli open-weight

Claude Opus 4.5 : nowa jakość w kodowaniu?

Nano Banana Pro: Precyzja, tekst i weryfikacja

Grok łagodnieje? Nowy model od xAI