Gemini 2.0 w stronę autonomii

Google zaprezentował najnowszy model AI. Czy to znaczący postęp? A może próba dogonienia konkurencji?

Adam Jędrusyna

Gemini 2.0 nowy projekt Google
Loading the Elevenlabs Text to Speech AudioNative Player…

Grudzień jest miesiącem podsumowań. Sam Altman zaprezentował nam 12 Days of Open AI, a Sundar Pitchai CEO Google’a ujawnił nowy model AI Gemini 2.0, który – wedle samych twórców – jest potężnym krokiem naprzód. 

Poprzednie modele

Gemini 1.0 i 1.5 skupiały się na multimodalności, czyli możliwości pracy z wieloma rodzajami danych; jak tekst, wideo, obraz, dźwięk i kod. Bardzo istotna dla tych modeli była również maksymalna długość kontekstu, czyli ilość informacji na podstawie której generowały odpowiedzi. Gemini 1.5 Pro mógł przetwarzać do 2 milionów tokenów. 

Najnowszy model 

Gemini 2.0 poprawia osiągi poprzedników i koncentruje się na agentach AI, którzy mogą rozwiązywać wieloetapowe problemy przy ograniczonym udziale człowieka. 

Nowe możliwości

Już teraz użytkownicy mogą testować niektóre z nowych możliwości Gemini 2.0. Na przykład funkcję „Deep Research”, która skanuje sieć w poszukiwaniu informacji i generuje łatwy do zrozumienia raport. Warto wspomnieć, że wspomagająca  wyszukiwanie funkcja AI Overviews, która kiedyś skompromitowała się tym, że zaproponowała klej do mocowania sera w pizzy, będzie wspomagana przez Gemini 2.0, co umożliwi obsługę złożonych zapytań: wieloetapowych i multimodalnych. 

Gemini 2.0 Flash

Google wprowadza również eksperymentalną wersję, którą  zaprojektowano specjalnie do zadań wymagających dużej szybkości przetwarzania. Gemini 2.0 Flash może obrabiać obrazy, przekształcać tekst w mowę. Umożliwia też deweloperom korzystanie z interfejsu API

Nowe projekty Astra i…

Astra to wszechstronny, osobisty asystent AI, który działa w czasie rzeczywistym i może pomagać nam w codziennych czynnościach. Korzysta z usług Google, takich jak Search, Lens i Maps. Oczywiście Astra jest wielojęzyczna i podobno będzie działała również w okularach VR. Projekt ten jest rozwinięciem poprzedniego. Google przygotował film pokazujący obecną wersję projektu Astra w działaniu. 

Projekt Mariner

Drugim projektem jest Mariner, obecnie we wstępnej fazie badawczej. To narzędzie, które pozwala AI przejąć kontrolę nad przeglądarką, by przeszukiwać sieć w poszukiwaniu informacji. Potrafi rozpoznawać piksele, obrazy, tekst i kod na stronie internetowej. Po przetworzeniu danych może poruszać się po sieci i znajdować odpowiedzi. Względy bezpieczeństwa pozwalają Marinerowi działać tylko w aktywnej karcie przeglądarki. Z kolei przed podjęciem „wrażliwych” działań, jak na przykład zakup jakiegokolwiek produktu lub subskrypcji, musi on poprosić o zgodę użytkownika.  

Na prezentacji Gemini 2 CEO Sundar Pitchai powiedział: „Rozwijając nowe technologie, zdajemy sobie sprawę z odpowiedzialności, jaką to ze sobą niesie.” Google stworzył interesujący model, który zapowiada bardzo ciekawy nowy rok.

Fan nowych technologii i historii. Z natury stoik i minimalista.

Podziel się

Może Cię zainteresować