Home Móvel Google Gemini atualizado com modelo Imagen 3 AI para geração de imagens,...

Móvel

Google Gemini atualizado com modelo Imagen 3 AI para geração de imagens, disponível para todos os usuários

October 20, 2024

Na quarta-feira, o Google anunciou uma atualização significativa para Gemini, seu modelo interno de inteligência artificial (IA). A empresa anunciou que os recursos de geração de imagens do chatbot agora serão alimentados pelo modelo Imagen 3 AI para todos os usuários. Imagen 3 é o modelo de geração de imagens mais recente e eficiente da gigante da tecnologia de Mountain View. Além dos aplicativos Gemini, esse recurso também será estendido à versão Gemini API para permitir que os desenvolvedores criem aplicativos e experiências com base nesse recurso.

Usuários Gemini ganham acesso ao modelo Imagen 3 AI

Em publicar no X (anteriormente conhecido como Twitter), o identificador oficial do aplicativo Google Gemini revelou que todos os usuários, incluindo usuários de nível gratuito, poderão gerar imagens usando o Imagen 3. A postagem destaca que o modelo de IA oferece um alto grau de fotorrealismo , proporciona melhor aderência e adiciona menos elementos indesejados às imagens.

A equipe do Gadgets 360 conseguiu verificar se o aplicativo Gemini realmente usa o Imagen 3 para gerar imagens. Para testar suas capacidades e compará-las com o Meta AI, demos a mesma solicitação a ambos os chatbots. A sugestão foi: “Faça um desenho de um cachorro golden retriever sentado no cais de um trem e olhando pela janela para os Alpes. O trem tem interior de madeira e os assentos são verdes. Todos os outros passageiros do trem também são animais. Um condutor verifica os ingressos.

Meta AI vs. Gêmeos

As imagens geradas podem ser vistas acima. Embora ambos os modelos de IA não incluíssem um ou mais dos elementos indicados na dica de ferramenta, o Gemini conseguiu incluir mais elementos. Além disso, enquanto o Meta AI gera imagens com resolução de 1280 x 1280, as imagens do Imagen 3 são geradas com resolução de 2048 x 2048.

O Imagen 3 pode gerar imagens em uma ampla variedade de estilos, como pinturas a óleo fotorrealistas e texturizadas e cenas em argila. Os usuários também podem solicitar que as fotos apareçam como se tivessem sido tiradas com uma câmera específica, como uma Nikon DSLR, estilo GoPro, lente grande angular e muito mais.

O Google afirma que seu modelo de IA possui salvaguardas integradas para reduzir o risco de deepfakes. Cada imagem gerada também recebe uma marca d’água com SynthID, uma tecnologia que adiciona um rótulo de IA invisível aos pixels da imagem. Não pode ser aparado ou removido. Está até presente em capturas de tela.

Fonte