Nano Banana Pro: Precyzja, tekst i weryfikacja

Google wprowadza Nano Banana Pro – model oparty na architekturze Gemini 3 Pro. Nowe rozwiązanie oferuje zaawansowaną obsługę tekstu, kontrolę nad oświetleniem oraz wbudowaną weryfikację SynthID.

Karolina Ceroń

21 lis 2025

Zaledwie kilka miesięcy po premierze modelu Nano Banana, Google zaprezentowało jego następcę – Nano Banana Pro (Gemini 3 Pro Image). O ile poprzednia wersja skupiała się na prostych edycjach i zabawie formą, wariant Pro stawia na precyzję niezbędną w pracy kreatywnej i studyjnej. Nowy model wykorzystuje zdolności wnioskowania Gemini 3 oraz dostęp do wiedzy o świecie w czasie rzeczywistym.

Wizualizacja danych i czytelny tekst

Jednym z największych wyzwań dla generatorów obrazu była dotychczas typografia. Nano Banana Pro radzi sobie z renderowaniem tekstu znacznie lepiej od poprzedników. Użytkownicy mogą generować grafiki z czytelnymi napisami – od krótkich haseł reklamowych po dłuższe akapity. Model obsługuje wiele języków, co pozwala na przykład na przetłumaczenie etykiet na produktach z zachowaniem oryginalnego stylu graficznego (np. z angielskiego na koreański).

Istotną nowością jest integracja z wyszukiwarką Google. Model potrafi wizualizować informacje pobierane na żywo. Pozwala to na tworzenie aktualnych infografik pogodowych, wykresów sportowych czy instrukcji krok po kroku (np. przepisu na herbatę z kardamonem) na podstawie rzeczywistych danych, a nie tylko halucynacji modelu.

Kontrola nad stylem i spójnością

Dla osób zajmujących się projektowaniem kluczowa jest powtarzalność. Nano Banana Pro umożliwia łączenie do 14 obrazów wejściowych przy zachowaniu spójności postaci i stylu. Oznacza to, że można wygenerować serię ujęć do storyboardu lub sesji modowej, w której bohaterowie i ich ubiór wyglądają tak samo na każdym kadrze, zmieniają się jedynie pozy i perspektywa.

Google oddaje w ręce twórców także bardziej zaawansowane narzędzia kontroli „studyjnej”. Możliwa jest edycja konkretnych fragmentów obrazu, zmiana kąta kamery, głębi ostrości (np. wyostrzenie kwiatów na pierwszym planie) oraz modyfikacja oświetlenia. Użytkownicy mogą zmienić porę dnia na zdjęciu z dziennej na nocną lub wprowadzić efekt chiaroscuro (mocny światłocień), zachowując przy tym oryginalne rysy twarzy postaci.

Dostępność i wdrożenia

Model jest wdrażany w różnych usługach Google, w zależności od grupy docelowej:

Użytkownicy indywidualni: Mogą korzystać z modelu w aplikacji Gemini (opcja „Thinking”). Wersja darmowa posiada limity, po których wyczerpaniu system przełącza się na podstawowy model Nano Banana. Subskrybenci pakietów Google AI Plus, Pro i Ultra otrzymują wyższe limity.
Firmy i profesjonaliści: Model trafia do Google Ads, Workspace (Slajdy, Vids) oraz dla programistów poprzez Gemini API i Google AI Studio.
Kreatywni: Subskrybenci Ultra otrzymają dostęp do narzędzi wideo (Flow) z większą precyzją kontroli scen.

Weryfikacja treści i SynthID

Wraz z nowym modelem Google kładzie duży nacisk na transparentność. Wszystkie grafiki generowane przez narzędzia firmy mają zawierać niewidoczny znak wodny SynthID. Od teraz w aplikacji Gemini dostępna ma być również funkcja weryfikacji – po przesłaniu pliku można zapytać bota: „Czy ten obraz został wygenerowany przez Google AI?”, aby otrzymać stosowną informację.

Dodatkowo wprowadzono rozróżnienie wizualne:

Obrazy generowane przez użytkowników darmowych i subskrybentów Pro będą oznaczone widocznym znakiem wodnym (iskierką).
Materiały tworzone przez subskrybentów Ultra oraz programistów w AI Studio będą pozbawione widocznego oznaczenia, aby zapewnić czysty obraz do użytku profesjonalnego.

Google wdraża również metadane zgodne ze standardem C2PA, co pozwoli na sprawdzanie pochodzenia obrazu również poza ekosystemem Google. Firma zapowiada, że wkrótce weryfikacja SynthID obejmie także materiały audio i wideo.

Jak to wygląda w praktyce? Sprawdźmy to

Obietnice producenta to jedno, ale w praktyce…cóż, bywa różnie. Postanowiłam to sprawdzić.

W przypadku generowania tekstów Gemini radzi sobie bardzo dobrze. Napisy na grafikach są czytelne, a model poprawnie interpretuje polecenia dotyczące typografii.

Przykładowa infografika wygenerowana przez Nano Banana Pro

Równie dobrze wypadł test integracji z danymi w czasie rzeczywistym. Poprosiłam model o wykonanie konkretnego zadania: „Stwórz aktualną infografikę pogodową dla Warszawy: temperatura, wilgotność, zachmurzenie oraz ikony pogody o wysokiej czytelności. Wykorzystaj dane w czasie rzeczywistym”. Rezultat był satysfakcjonujący – otrzymałam dość estetyczną grafikę z poprawnymi danymi meteo. (Chociaż wybiegł trochę w przyszłość – test robiłam o 18:14, a na infografice widzimy 18:30)

Grafika z danymi pogodowymi pobranymi przez Gemini w czasie rzeczywistym

Mieszane uczucia budzi natomiast funkcja rozpoznawania obrazów AI. Mimo zapowiedzi o łatwej weryfikacji, gdy chciałam to sprawdzić, system nie rozpoznał dwóch grafik wygenerowanych chwilę wcześniej przez ten sam model. Wygląda na to, że na w pełni działający mechanizm SynthID w aplikacji będziemy musieli jeszcze chwilę poczekać.

Zrzut ekranu odpowiedzi Gemini 3 Thinking

Karolina Ceroń

Współtwórczyni newslettera AI Flash, studentka psychologii i pasjonatka sztucznej inteligencji. Interesuję się wpływem nowych technologii na człowieka, a w wolnych chwilach eksperymentuję z generatywną grafiką w Midjourney.

Podziel się

AI, gemini, genai, google

Podziel się

Może Cię zainteresować

Karolina Ceroń

Premiera GPT-5.2. Nowa seria modeli do zadań specjalnych

OpenAI udostępnia serię GPT-5.2, stworzoną z myślą o profesjonalnej pracy. Według deklaracji twórców, nowe modele mają lepiej radzić sobie z kodowaniem, analizą danych i długimi dokumentami, popełniając przy tym znacznie mniej błędów.

12.12
Karolina Ceroń

Mistral 3: Premiera nowej generacji modeli open-weight

Mistral AI prezentuje rodzinę modeli Mistral 3. Obejmuje ona wariant Large w architekturze MoE oraz serię Ministral na urządzenia lokalne. Wszystkie modele udostępniono na licencji Apache 2.0.

04.12
Karolina Ceroń

Claude Opus 4.5 : nowa jakość w kodowaniu?

Anthropic prezentuje Opus 4.5 – model, który ma przewyższać inżynierów w testach technicznych, kosztując przy tym ułamek ceny poprzednika.

27.11
Karolina Ceroń

Grok łagodnieje? Nowy model od xAI

xAI wprowadza Groka 4.1 – najnowszą wersję swojego modelu językowego. Firma deklaruje znaczącą poprawę w zakresie rozumienia intencji, spójności wypowiedzi oraz redukcji błędów, co ma przełożyć się na wyższą jakość interakcji z…

19.11

Nano Banana Pro: Precyzja, tekst i weryfikacja

Wizualizacja danych i czytelny tekst

Kontrola nad stylem i spójnością

Dostępność i wdrożenia

Weryfikacja treści i SynthID

Jak to wygląda w praktyce? Sprawdźmy to

Podziel się

Podziel się

Może Cię zainteresować

Premiera GPT-5.2. Nowa seria modeli do zadań specjalnych

Mistral 3: Premiera nowej generacji modeli open-weight

Claude Opus 4.5 : nowa jakość w kodowaniu?

Grok łagodnieje? Nowy model od xAI