Google udostępniło wszystkim użytkownikom Gemini swoje szeroko komentowane narzędzie do edycji obrazów o nazwie kodowej „nano banana” (oficjalnie Gemini 2.5 Flash Image). Narzędzie umożliwiające szczegółową edycję istniejących zdjęć jest teraz dostępne za pośrednictwem aplikacji Gemini, AI Studio, a także platform deweloperskich, takich jak Vertex AI i Gemini API.
Szybkie wdrożenie i możliwości
Wydanie następuje po okresie dużego zaangażowania użytkowników, kiedy to Google zgłosiło utworzenie ponad 5 miliardów obrazów przy użyciu sztucznej inteligencji i pozyskanie ponad 10 milionów nowych użytkowników Gemini dzięki popularności narzędzia w pierwszych tygodniach jego działania. W przeciwieństwie do wielu generatorów obrazów AI, które tworzą treści od podstaw, nano banana doskonale radzi sobie z udoskonalaniem istniejących obrazów poprzez dodawanie lub zmianę elementów z niesamowitą precyzją.
Wstępne testy pokazują, że model szczególnie dobrze radzi sobie z zapytaniami pozytywnymi i negatywnymi, co oznacza, że może dokładnie postępować zgodnie z instrukcjami dotyczącymi co należy zmienić, a czego nie należy zmieniać. Demonstruje także możliwość dokładnego zintegrowania tekstu z obrazami, pod warunkiem, że zapytania uwzględniają określone style czcionek i kolory.
Jak uzyskać dostęp do Nano Banana
Użytkownicy mogą uzyskać dostęp do narzędzia na kilka sposobów:
- Aplikacja Gemini: Bezpośrednio w aplikacji Gemini po ogólnej premierze w październiku.
- AI Studio: Wybieranie obrazu Flash 2.5 jako modelu w Google AI Studio.
- Integracja z Adobe: Dostępny jako model innej firmy w programach Adobe Photoshop (wypełnienie generatywne), Adobe Express i Firefly.
Polityka prywatności Google dotyczy wszystkich zastosowań: przesłane obrazy mogą zostać wykorzystane do ulepszenia sztucznej inteligencji, dlatego użytkownicy powinni unikać publikowania poufnych treści. Edytowane zdjęcia nie są znakowane znakiem wodnym, więc na użytkowniku spoczywa obowiązek przejrzystego informowania o korzystaniu z sztucznej inteligencji.
Wskazówki dotyczące efektywnego użytkowania
Aby osiągnąć maksymalne wyniki, użytkownicy powinni przestrzegać następujących wskazówek:
- Bądź konkretny: szczegółowe zapytania dają lepsze wyniki. Uwzględnij palety kolorów, style i pożądaną estetykę.
- Określ negatywy: Powiedz AI czego nie należy zmieniać. Banan Nano radzi sobie z negatywnymi żądaniami lepiej niż wielu konkurentów.
- Dokładne instrukcje dotyczące tekstu: Dodając tekst, podaj dokładne sformułowanie, styl i szczegóły koloru.
Oprócz prostych edycji narzędzie może generować wariacje na temat istniejących obrazów (takie jak różne fryzury na portrecie) i działać jako gumka oparta na sztucznej inteligencji, która usuwa rozpraszające elementy tła. Chatbot Gemini może również pomóc w przeprowadzeniu burzy mózgów i wyjaśnieniu zapytań, gdy użytkownicy utknęli.
To ważny krok naprzód dla Google w wyścigu AI. Nacisk na edycję istniejących zdjęć, a nie tylko na ich generowanie, to odświeżające podejście, które podoba się wielu użytkownikom.
Szeroka dostępność „nano banana” podkreśla zaangażowanie Google w integrację sztucznej inteligencji z codziennymi narzędziami, dzięki czemu zaawansowana edycja obrazów będzie dostępna szerszemu gronu odbiorców.
