Zaorać i zasiać na nowo? OpenAI na zakręcie

Gemini 3 w jednej chwili pokazał, że przewaga rynkowa nigdy nie jest dana raz na zawsze. Czy OpenAI ma szanse na to, by przekuć porażkę w sukces?

Krzysztof Mirończuk

Loading the Elevenlabs Text to Speech AudioNative Player…

W ubiegłym tygodniu tylko jeden news ze świata AI miał rzeczywiste znaczenie – Gemini 3 zakwestionował pewnik, który przez ostatnie dwa lata dominował w branży: że OpenAI nie da się dogonić. Chwilę później do sieci trafiło rzekome wewnętrzne memo Sama Altmana, w którym szef OpenAI przyznaje, że firmę czeka okres „rough vibes” i krótkoterminowej presji. Nie wiemy, czy ta notatka jest autentyczna, ale dla twórców ChataGPT byłoby lepiej, gdyby była. Bo oznaczałaby, że OpenAI podchodzi do problemu poważnie i ma plan, jak mu zaradzić.

Nagła (?) zmiana lidera

Przez długi czas układ sił wydawał się stabilny. W powszechnym rozumieniu AI = ChatGPT.  OpenAI nadawało tempo, Google, Meta próbowali nadążyć, a pozostałe firmy szukały własnych nisz, licząc, że uda im się zbudować przewagę w specjalistycznych zastosowaniach. Każda nowa wersja GPT wzmacniała tę narrację. To OpenAI decydowało, jak wygląda krajobraz AI, a cała reszta rynku dopisywała się do jego linii rozwojowej.

Wraz z premierą Gemini 3 nastąpiło jednak przesunięcie niemal „tektoniczne”. Benchmarki, które przez długi czas były wyrównane lub nieco przechylone w stronę OpenAI, nagle zaczęły wskazywać na wyraźną przewagę Google w obszarach, które dotąd stanowiły domenę GPT: złożone rozumowanie, multimodalność, interpretacja danych wizualnych oraz zadania quasi-poznawcze, tak intensywnie testowane w nowych benchmarkach AGI.

Skala różnic jest na tyle duża, że nie da się jej zignorować ani zamieść pod dywan PR-owymi narracjami o różnicach w metodologii. Gemini 3 objął prowadzenie bezdyskusyjnie i to w obszarach kluczowych dla przyszłości AI. Rynek po raz pierwszy od dawna poczuł, że tabela liderów może się zmieniać, a na dokładkę – zadziało się to praktycznie z dnia na dzień.

Chwilę potem w internecie pojawiły się informacje na temat memo Altmana skierowanego do pracowników. Dokument nie jest katastroficzny, nie ma w nim tonu obronnego, ale zawiera zdania, które jasno sygnalizują zmianę fazy. Altman pisze o „rough vibes”(trudnej atmosferze), o „temporary headwinds” (chwilowych turbulencjach) i o konieczności skupienia się na „very ambitious long term bets” (bardzo ambitnych, długoterminowych zakładach/wyzwaniach) . Brzmi to jak deklaracja wycofania się z krótkoterminowego wyścigu, ale jednocześnie jak komunikat o budowaniu czegoś znacznie większego. Nie jest to list człowieka, który boi się utraty pozycji. To list lidera, który mówi swoim ludziom: teraz czeka nas najtrudniejsze zadanie, a jego elementem jest to, że musimy zaakceptować fakt, że mamy chwilowe problemy.

OpenAI pod ścianą

Coraz więcej danych wskazuje na to, że prawdziwy problem OpenAI leży bowiem w fundamentach procesu tworzenia modeli. Branża mówi o „ścianie pre-trainingu”, którą OpenAI miało napotkać, próbując wycisnąć z dotychczasowych metod więcej, niż te były w stanie dać. W praktyce oznacza to sytuację, w której każda kolejna porcja zasobów obliczeniowych przynosi coraz mniejszy zwrot jakości. Firma dysponuje ogromną infrastrukturą, ale pipeline danych, metody oczyszczania, harmonogramy optymalizacji i warstwy treningowe zaczynają spowalniać dalszy rozwój. Wydawało się, że nie ma rozwiązania dla tego problemu…

Google tymczasem pokazało coś, co wygląda jak powrót do korzeni. Dopracowany pre-training, gigantyczne zbiory danych, zoptymalizowana infrastruktura i ścisła integracja modeli z produktami usługowymi pokazały, że klasyczna ścieżka rozwoju wciąż może generować ogromne skoki jakości. To nie była rewolucja architektoniczna. To była rewolucja organizacyjna. I właśnie ta różnica najbardziej zabolała OpenAI.

Czas na reset?

W kontekście przecieku memo Altmana pojawia się też nazwa Shallotpeat. To projekt, który według doniesień ma naprawić to, co przez długi czas narastało w fundamentach procesów treningowych OpenAI. Nazwa, jakkolwiek brzmi dość lekko, niemal humorystycznie (znaczy dosłownie: „Wymiana gleby pod uprawę”, w Polsce penie użyliśmy sformułowania „zaoranie”), doskonale oddaje metaforę przesłania: wymienić podłoże, zanim postawi się na nim kolejny drapacz chmur. Shallotpeat ma podobno poprawić czystość i strukturę danych, usprawnić pipeline’y, usunąć problemy jakości i przygotować pole pod kolejne skokowe zwiększenie możliwości.

Jeśli to się powiedzie, nie będzie to jedynie odpowiedź na Gemini 3. To będzie nowa fabryki, nie nowy model

Warto tu zauważyć, że Altman od dawna mówi o celach wykraczających poza klasyczną rywalizację benchmarkową. W wielu wystąpieniach podkreśla, że prawdziwym przełomem nie będzie GPT 6 ani GPT 7, lecz automatyzacja badań nad AI. Modele, które piszą kod dla innych modeli. Modele, które projektują eksperymenty treningowe. Modele, które potrafią analizować własne błędy i generować zestawy poprawek. Wygra nie ten, kto ma najlepszy model, ale ten, kto ma najlepszy proces jego tworzenia. Właśnie dlatego OpenAI zaczęło inwestować w zmianę organizacyjną, a nie tylko parametrową. Shallotpeat wydaje się pierwszym krokiem tej ewolucji.

Piłka wciąż w grze

Czy więc OpenAI faktycznie traci prowadzenie? W jednym wymiarze tak. Benchmarki są dziś po stronie Google. Jednak w całej reszcie obrazu sytuacja jest bardziej złożona. OpenAI nadal ma największą platformę użytkowników, najbardziej rozbudowany ekosystem narzędzi, najsilniejszą obecność w integracjach biznesowych i najbardziej aktywne community programistów. Może więc przegrać sprint, ale wygrywać maraton.

Dla rynku oznacza to okres największej niepewności od czasu premiery GPT 4. Jeśli Google utrzyma tempo, narzędzia oparte na AI będą w coraz większym stopniu migrować do Gemini, a przedsiębiorstwa zaczną planować swoje strategie wokół produktów DeepMind. Jeśli OpenAI wróci z przełomem, którym miałby być model wyrosły z poprawionego pipeline’u, możemy być świadkami kolejnego skoku na miarę zmiany z GPT 3.5 na GPT 4. Najbardziej prawdopodobny jest jednak scenariusz, w którym obie firmy przyspieszą równolegle, co doprowadzi do najbardziej intensywnej rywalizacji technologicznej dekady.

Od lat zajmuję się nowymi technologiami w biznesie, edukacji i codziennym życiu. W centrum mojej uwagi pozostaje człowiek – i to, by technologia wyrównywała szanse, zamiast tworzyć bariery.

Podziel się

Może Cię zainteresować