Twój koszyk jest obecnie pusty!
W mitologii greckiej Atlas był tytanem skazanym na dźwiganie ciężaru nieboskłonu. Dziś, w erze cyfrowej, ciężarem stał się sam internet – nadmiar informacji, chaos zakładek i złożone zadania. Wydaje się, że ten cyfrowy ciężar chce teraz przejąć OpenAI, prezentując ChatGPT Atlas – przeglądarkę, która ma aktywnie rozumieć kontekst, pamiętać poprzednie interakcje i samodzielnie wykonywać za nas zadania. To próba zbudowania od podstaw nowego sposobu interakcji z internetem, w którego centrum nie znajduje się pasek adresu, ale inteligentny asystent.
Przeglądarka, która wie, co robisz
Główną ideą Atlas jest przełamanie największej bariery współczesnych chatbotów: braku kontekstu. Zamiast kopiować tekst, robić zrzuty ekranu i wklejać je do osobnego okna czatu, Atlas ma natywnie i w czasie rzeczywistym rozumieć, co aktualnie dzieje się na stronie. ChatGPT staje się asystentem obecnym stale w bocznym panelu, gotowym do pomocy bez przełączania zakładek.
„Podczas wykładów lubię używać pytań praktycznych i przykładów z życia, aby naprawdę zrozumieć materiał” – komentuje Yogya Kalra, student i jeden z pierwszych testerów. „Kiedyś przełączałem się między slajdami a ChatGPT, robiąc zrzuty ekranu tylko po to, by zadać pytanie. Teraz ChatGPT natychmiast rozumie, na co patrzę, pomagając mi na bieżąco”. To prosta zmiana, która fundamentalnie zmienia dynamikę pracy – od przerywania jej w celu zadania pytania, do płynnej asysty w jej trakcie.
Dwa rodzaje pamięci dla „superasystenta”
Aby asystent był naprawdę pomocny, musi się uczyć. Atlas wprowadza do tego dwa mechanizmy. Pierwszy to znana już pamięć ChatGPT, która bazuje na poprzednich rozmowach i pozwala zachować ciągłość konwersacji (np. pamięta, nad jakim projektem pracujemy).
Druga, znacznie potężniejsza, to pamięć przeglądarki. Pozwala Atlasowi aktywnie zapamiętywać kontekst z odwiedzanych stron. Dzięki synergii obu pamięci, można zadawać pytania przekrojowe, na przykład: „Znajdź wszystkie oferty pracy na stanowisko marketing managera, które przeglądałem w zeszłym tygodniu. Na ich podstawie stwórz podsumowanie najczęstszych wymagań i trendów w branży, abym mógł przygotować się do rozmów kwalifikacyjnych”. Funkcja ta jest w pełni opcjonalna, a zebrane „wspomnienia” można w każdej chwili przejrzeć, zarchiwizować lub usunąć.
Tryb Agenta: Twój osobisty stażysta do zadań w sieci
Najbardziej zaawansowaną funkcją Atlasa jest Tryb Agenta. To krok w stronę systemów, w których AI od odpowiadania na pytania przechodzi do autonomicznego wykonywania za nas zadań, klikając i nawigując po stronach tak, jak zrobiłby to człowiek. Użytkownik może poprosić ChatGPT o zrealizowanie wieloetapowego procesu.
OpenAI podaje dwa przykłady. Planujesz kolację? Możesz przekazać agentowi przepis i poprosić go o znalezienie sklepu spożywczego online, dodanie wszystkich składników do koszyka i zamówienie ich z dostawą do domu. W pracy? Możesz polecić mu, aby otworzył i przeczytał dokumenty zespołu z ostatniego kwartału, przeprowadził nową analizę konkurencji w sieci, a następnie zebrał wnioski w formie briefu.
Tryb agenta jest na razie dostępny w wersji preview dla płatnych subskrybentów. OpenAI zaznacza, że to wczesna wersja, która może popełniać błędy przy bardziej złożonych przepływach pracy.
Pełna kontrola, pełna odpowiedzialność?
Wizja przeglądarki, która „pamięta” każdy nasz ruch i „działa” w naszym imieniu, budzi uzasadnione obawy o prywatność. OpenAI poświęca temu zagadnieniu sporo uwagi. Oprócz standardowego trybu incognito, Atlas pozwala na granularne zarządzanie widocznością. Za pomocą przełącznika w paskku adresu można w każdej chwili zablokować ChatGPT dostęp do treści na konkretnej stronie.
Firma zapewnia, że domyślnie treści przeglądane przez użytkownika nie są używane do trenowania modeli. Użytkownik ma jednak możliwość świadomego włączenia tej opcji (opt-in), aby pomóc w ulepszaniu AI. Przeglądarka respektuje również standardy sieciowe – strony, które blokują bota GPTBot
, nie będą brane pod uwagę w procesie treningu, nawet przy włączonej zgodzie. Dodatkowo, istniejące ustawienia kontroli rodzicielskiej z konta ChatGPT są automatycznie przenoszone do Atlas, a rodzice otrzymają nowe narzędzia, pozwalające wyłączyć pamięć przeglądarki i tryb agenta.
Co ważniejsze, tryb agenta otrzymał szereg „twardych” zabezpieczeń. Agent nie może uruchamiać kodu w przeglądarce, pobierać plików ani instalować rozszerzeń. Nie ma również dostępu do innych aplikacji ani systemu plików komputera. Dodatkowo, jego działanie zostanie automatycznie wstrzymane na stronach wrażliwych (np. instytucji finansowych), aby użytkownik mógł ręcznie potwierdzić operację.
Jednocześnie firma otwarcie przyznaje, że agenci AI niosą ze sobą nowe ryzyka. Chodzi m.in. o ataki, w których złośliwe instrukcje ukryte na stronie internetowej mogą próbować „przechwycić” agenta. OpenAI formułuje mocne ostrzeżenie, przyznając, że ich zabezpieczenia „nie zatrzymają każdego ataku”, jaki może się pojawić w miarę wzrostu popularności agentów AI.
Bitwa o rynek: Atlas kontra reszta świata
Wejście Atlasa na rynek wywołało natychmiastową reakcję – wartość rynkowa Alphabet, spółki-matki Google, spadła o 150 miliarda dolarów. To pokazuje, że Atlas nie jest postrzegany jako kolejna przeglądarka, ale fundamentalne zagrożenie dla dominacji wyszukiwarki Google. Atlas wchodzi jednak na zatłoczone pole bitwy. Jego bezpośrednim rywalem w segmencie „AI-first” jest Perplexity Comet, który oferuje podobną filozofię przeglądania opartego na konwersacji. Największym rywalem pozostaje jednak Google, które posiada potężną broń w postaci rynkowej inercji miliardów użytkowników Chrome i intensywnie integruje z nim własnego agenta Gemini.
OpenAI nie chce, aby jego technologia była tylko gościem w ekosystemie Google czy Apple – buduje własny. Premiera na macOS (wersje na Windows, iOS i Android są w przygotowaniu) to dopiero początek wyścigu o to, kto stworzy domyślny interfejs do interakcji z internetem nowej generacji.