O Google disponibilizou sua amplamente discutida ferramenta de edição de imagens de IA, apelidada de “nano banana” (formalmente Gemini 2.5 Flash Image), para todos os usuários do Gemini. A ferramenta, que permite a edição detalhada de fotos existentes, agora está acessível por meio do aplicativo Gemini, AI Studio e plataformas de desenvolvedores como Vertex AI e Gemini API.

Rápida adoção e capacidades

O lançamento segue um período de envolvimento significativo dos usuários: o Google relata mais de 5 bilhões de imagens de IA criadas e mais de 10 milhões de novos usuários do Gemini atribuídos à popularidade da ferramenta nas primeiras semanas. Ao contrário de muitos geradores de imagens de IA que criam do zero, o “nano banana” é excelente no refinamento de imagens existentes, adicionando ou alterando elementos com uma precisão surpreendente.

Os primeiros testes mostram que o modelo é notavelmente adepto da compreensão de estímulos positivos e negativos – o que significa que ele pode seguir com precisão as instruções sobre o que deve mudar e o que não de fazer. Ele também demonstrou capacidade de integração precisa de texto em imagens, desde que os prompts incluam estilos e cores de fonte específicos.

Como acessar o Nano Banana

Os usuários podem acessar a ferramenta de diversas maneiras:

  • Aplicativo Gemini: Diretamente no aplicativo Gemini, após o lançamento geral em outubro.
  • AI Studio: selecionando 2.5 Flash Image como modelo no AI Studio do Google.
  • Integração com Adobe: Disponível como modelo de terceiros no Adobe Photoshop (Generative Fill), Adobe Express e Firefly.

A política de privacidade do Google se aplica a todos os usos: as imagens enviadas podem ser usadas para melhorar a IA, portanto, os usuários devem evitar compartilhar conteúdo confidencial. As fotos editadas não possuem marca d’água, o que significa que a transparência em relação ao uso da IA ​​é de responsabilidade do usuário.

Dicas para uso eficaz

Para maximizar os resultados, os usuários devem seguir estas diretrizes:

  • Seja específico: instruções detalhadas geram melhores resultados. Inclua paletas de cores, estilos e estética desejada.
  • Especifique os negativos: Diga à IA o que não deve ser alterado. “Nano banana” lida com solicitações negativas melhor do que muitos concorrentes.
  • Instruções de texto precisas: Ao adicionar texto, forneça palavras exatas, estilo e detalhes de cores.

Além de edições simples, a ferramenta pode gerar variações de imagens existentes (por exemplo, diferentes estilos de cabelo em um retrato) e atuar como uma borracha com tecnologia de IA para distrações de fundo. O chatbot do Gemini também pode ajudar no brainstorming de ideias e no refinamento de prompts quando os usuários estão travados.

Isto marca um avanço significativo para o Google na corrida da IA. O foco na edição de fotos existentes, em vez de apenas gerar novas, é uma abordagem refrescante que agrada a muitos usuários.

A ampla disponibilidade da “nano banana” ressalta o compromisso do Google em integrar a IA nas ferramentas cotidianas, tornando a edição avançada de imagens acessível a um público mais amplo.