Twój koszyk jest obecnie pusty!
OpenAI docelowo obniży koszty tokenów także przy generowaniu grafik, wideo i audio. Twórca ChatGPT kontynuuje zobowiązanie spółki, które ma umożliwić szeroki dostęp do rozwiązań bazujących na sztucznej inteligencji. Tak szeroki, jak tylko to możliwe – wspomniał Sam Altman – CEO OpenAI. I wierzy, że udostępniony model GPT4-o mini znacznie rozszerzy zakres rozwiązań tworzonych w oparciu o AI, co przełoży się na większą dostępność dla końcowych użytkowników.
Co potrafi GPT-4o mini?
Jak informują pracownicy firmy, dziś model GPT-4o mini obsługuje tekst i widzenie poprzez API. Obsługuje również wejściowe i wyjściowe zadania tekstowe. Potwierdzają także, że w niedalekiej przyszłości mały model będzie obsługiwał również grafiki, wideo i audio. Dziś te formaty są już obsługiwane przez nowy model, ale koszt nadal jest wyższy, tak jak przy GPT-4o.
Z opublikowanych informacji dowiadujemy się jeszcze, iż model ma okno kontekstowe dla 128 tys. tokenów, a obsługuje do 16 tys. tokenów wyjściowych przy jednostkowym żądaniu. Wytrenowane dane pochodzą z okresu do października 2023 roku, a obsługa tekstu nieanglojęzycznego jest zoptymalizowana, dzięki czemu stała się bardziej opłacalna.
Efektywność nowego modelu GPT-4o mini. Jak wypada na tle konkurencji?
Jak pokazuje poniższy benchmark, niewielki model wykazuje się doskonałą inteligencją tekstową i rozumowaniem multimodalnym. OpenAI, na potrzeby testów, zaprosił do współpracy firmy Ramp i Superhuman, które zgodnie wykazły, iż GPT-4o mini działa znacznie lepiej niż poprzednik GPT-3.5 Turbo. Dojście do tych wniosków możliwe było dzięki przeprowadzeniu zadań takich jak wyodrębnianie ustrukturyzowanych danych z paragonów czy przy generowaniu wysokiej jakości odpowiedzi na e-mail, także w przypadkach, w których korespondencja zawierała historię wcześniejszych wiadomości.
Inżynierowie z OpenAI na oficjalnej stronie pokazują także kilka innych przykładów tego, jak radzi sobie najnowszy model:
- Zadania rozumowania: GPT-4o mini osiągnął wynik 82,0% na MMLU w testach inteligencji tekstowej oraz rozumowania. Dla porównania, Gemini Flash osiągnął wyniki do 77,9%, a Claude Haiku do 73,8%.
- Zadania matematyczne i kodowanie: w tym obszarze osiągnął model od OpenAI wynik 87,0%, zaś konkurencyjne modele osiągają poziom 75% (Gemini Flash) czy 71,7% (Claude Haiku). Z kolei na HumanEval, gdzie mierzy się wydajność kodowania, GPT-4o mini uzyskał wynik na poziomie 87,2%. Gemini Flash dobił do 71,5% a Claude Haiku do 75,9%.
- Zadania z rozumowania multimodalnego: najnowszy mini model wygenerował wynik na poziomie 59,4%. Ale akurat w tej kategorii Gemini Flash i Claude Haiku wcale nie są daleko w tyle. Osiągnęły wyniki odpowiednio 56,1% i 50,2%.
Jakie wygląda bezpieczeństwo, dostępność i cennik modelu GPT-4o mini?
Choć najnowszy model AI jest dużo mniejszy niż GPT-3.5 Turbo czy GPT4-o, kwestie bezpieczeństwa pozostają bez zmian. Przypomnijmy, że podczas trenowania danych, odfiltrowane są: mowa nienawiści, treści dla dorosłych lub/i strony, na które agregują dane osobowe oraz spam. W kolejnym etapie dostosowywane są zachowania modelu do zasad określonych przez OpenAI, stosując takie techniki jak uczenie maszynowe poprzez RLHF, aby poprawić dokładność i niezawodność generowanych odpowiedzi.
Kwestie bezpieczeństwa są dla amerykańskiej firmy tak samo ważne, jak szeroka dostępność sztucznej inteligencji. Dlatego nowy model GPT-4o mini będzie dostępny w każdej formie API. Deweloperzy, którzy korzystają z API zapłacą 15 centów za milion tokenów wejściowych i 60 centów za milion tokenów wyjściowych. Dodatkowo, użytkownicy ChatGPT (w planach Free, Plus i Team) dostali dostęp do GPT-4o mini w zastępstwie za dostępny do niedawna model GPT-3.5. Z kolei użytkownicy korporacyjni muszą uzbroić się w cierpliwość, bowiem z modelu mini będą mogli skorzystać niebawem. Koszt dostępu do GPT-4o mini dla użytkowników ChatGPT pozostaje bez zmian. Oznacza to, że mogą z niego korzystać również klienci bezpłatnego pakietu.
Wizja OpenAI ma szansę się ziścić?
Wspomniałem już, że misją OpenAI jest przede wszystkim umożliwienie taniego dostępu do sztucznej inteligencji dla jak najszerszej grupy odbiorców. Firma wyobraża sobie, że w niedalekiej przyszłości takie modele jak GPT-4o mini będą bezproblemowo zintegrowane z każdą aplikacją i każdą stroną internetową. Te śmiałe cele już teraz toruje drogę programistom do bardziej wydajnego i niedrogiego tworzenia narzędzi AI.