Twój koszyk jest obecnie pusty!
Grudzień jest miesiącem podsumowań. Sam Altman zaprezentował nam 12 Days of Open AI, a Sundar Pitchai CEO Google’a ujawnił nowy model AI Gemini 2.0, który – wedle samych twórców – jest potężnym krokiem naprzód.
Poprzednie modele
Gemini 1.0 i 1.5 skupiały się na multimodalności, czyli możliwości pracy z wieloma rodzajami danych; jak tekst, wideo, obraz, dźwięk i kod. Bardzo istotna dla tych modeli była również maksymalna długość kontekstu, czyli ilość informacji na podstawie której generowały odpowiedzi. Gemini 1.5 Pro mógł przetwarzać do 2 milionów tokenów.
Najnowszy model
Gemini 2.0 poprawia osiągi poprzedników i koncentruje się na agentach AI, którzy mogą rozwiązywać wieloetapowe problemy przy ograniczonym udziale człowieka.
Nowe możliwości
Już teraz użytkownicy mogą testować niektóre z nowych możliwości Gemini 2.0. Na przykład funkcję „Deep Research”, która skanuje sieć w poszukiwaniu informacji i generuje łatwy do zrozumienia raport. Warto wspomnieć, że wspomagająca wyszukiwanie funkcja AI Overviews, która kiedyś skompromitowała się tym, że zaproponowała klej do mocowania sera w pizzy, będzie wspomagana przez Gemini 2.0, co umożliwi obsługę złożonych zapytań: wieloetapowych i multimodalnych.
Gemini 2.0 Flash
Google wprowadza również eksperymentalną wersję, którą zaprojektowano specjalnie do zadań wymagających dużej szybkości przetwarzania. Gemini 2.0 Flash może obrabiać obrazy, przekształcać tekst w mowę. Umożliwia też deweloperom korzystanie z interfejsu API.
Nowe projekty Astra i…
Astra to wszechstronny, osobisty asystent AI, który działa w czasie rzeczywistym i może pomagać nam w codziennych czynnościach. Korzysta z usług Google, takich jak Search, Lens i Maps. Oczywiście Astra jest wielojęzyczna i podobno będzie działała również w okularach VR. Projekt ten jest rozwinięciem poprzedniego. Google przygotował film pokazujący obecną wersję projektu Astra w działaniu.
Projekt Mariner
Drugim projektem jest Mariner, obecnie we wstępnej fazie badawczej. To narzędzie, które pozwala AI przejąć kontrolę nad przeglądarką, by przeszukiwać sieć w poszukiwaniu informacji. Potrafi rozpoznawać piksele, obrazy, tekst i kod na stronie internetowej. Po przetworzeniu danych może poruszać się po sieci i znajdować odpowiedzi. Względy bezpieczeństwa pozwalają Marinerowi działać tylko w aktywnej karcie przeglądarki. Z kolei przed podjęciem „wrażliwych” działań, jak na przykład zakup jakiegokolwiek produktu lub subskrypcji, musi on poprosić o zgodę użytkownika.
Na prezentacji Gemini 2 CEO Sundar Pitchai powiedział: „Rozwijając nowe technologie, zdajemy sobie sprawę z odpowiedzialności, jaką to ze sobą niesie.” Google stworzył interesujący model, który zapowiada bardzo ciekawy nowy rok.