Google випустив для всіх користувачів Gemini свій інструмент для редагування зображень, про який багато говорили, під кодовою назвою «nano banana» (офіційна назва — Gemini 2.5 Flash Image). Інструмент, який дозволяє детально редагувати наявні фотографії, тепер доступний через додаток Gemini, AI Studio, а також такі платформи розробників, як Vertex AI і Gemini API.

Швидке впровадження та можливості

Випуск відбувся після періоду сильної зацікавленості користувачів, коли Google повідомив про створення понад 5 мільярдів зображень за допомогою штучного інтелекту та придбання понад 10 мільйонів нових користувачів Gemini завдяки популярності інструменту в перші тижні роботи. На відміну від багатьох генераторів зображень зі штучним інтелектом, які створюють вміст з нуля, nano banana чудово вдосконалює існуючі зображення, додаючи або змінюючи елементи з неймовірною точністю.

Початкові тести показали, що модель особливо добре розуміє як позитивні, так і негативні запити, тобто вона може точно слідувати інструкціям про те, що потрібно змінити, а що не слід змінювати. Він також демонструє здатність точно інтегрувати текст у зображення за умови, що запити містять певні стилі та кольори шрифту.

Як отримати доступ до Nano Banana

Користувачі можуть отримати доступ до інструменту кількома способами:

  • Додаток Gemini: безпосередньо в додатку Gemini після загального випуску в жовтні.
  • AI Studio: вибір 2.5 Flash Image як моделі в Google AI Studio.
  • Інтеграція Adobe: доступна як стороння модель в Adobe Photoshop (Generative Fill), Adobe Express і Firefly.

Політика конфіденційності Google поширюється на всі види використання: завантажені зображення можуть використовуватися для покращення ШІ, тому користувачам слід уникати публікації конфіденційного вмісту. Відредаговані фотографії не мають водяних знаків, тому користувач повинен бути прозорим щодо використання ШІ.

Поради щодо ефективного використання

Для досягнення максимального результату користувачі повинні дотримуватися таких вказівок:

  • Будьте конкретними: детальні запити дають кращі результати. Додайте колірні палітри, стилі та бажану естетику.
  • Вкажіть мінуси: Скажіть штучному інтелекту що не слід змінювати. Nano banana справляється з негативними запитами краще за багатьох своїх конкурентів.
  • Інструкції щодо точного тексту: Додаючи текст, укажіть точні формулювання, стиль і деталі кольору.

Окрім простого редагування, інструмент може генерувати варіації наявних зображень (наприклад, різні зачіски на портреті) і діяти як гумка на основі штучного інтелекту для видалення відволікаючих елементів фону. Чат-бот Gemini також може допомогти з мозковим штурмом і уточненням запитів, коли користувачі застрягли.

Це важливий крок вперед для Google у гонці ШІ. Акцент на редагуванні наявних фотографій, а не на їх чистому створенні, є освіжаючим підходом, який подобається багатьом користувачам.

Широка доступність «нанобанана» підкреслює прагнення Google інтегрувати штучний інтелект у щоденні інструменти, роблячи розширене редагування зображень доступним для ширшої аудиторії.