Google I/O 2024: Apresentou o modelo 3 de inteligência artificial de texto para imagem com recursos aprimorados de geração de imagens

Durante seu evento anual para desenvolvedores Google I/O 2024, o Google anunciou algumas novas informações. Dos muitos anúncios sobre inteligência artificial (IA) feitos durante a sessão de abertura, um foi particularmente surpreendente. A gigante da tecnologia apresentou a próxima geração de seu modelo de IA de texto para imagem, Imagen 3. O novo modelo de IA foi apresentado poucos meses após o lançamento de seu antecessor Imagen 2, lançado em dezembro de 2023 e posteriormente atualizado no mês passado. A empresa afirma que o novo modelo pode gerar imagens detalhadas e fotorrealistas seguindo rigorosamente as instruções.

A imagem 3 foi apresentada por Douglas Eck, Diretor Sênior de Pesquisa do Google DeepMind. Ao revelá-lo, ele disse: “Hoje estou muito animado em apresentar o Imagen 3. É o nosso modelo de geração de imagens mais poderoso até o momento. Compreende os prompts escritos da mesma forma que as pessoas escrevem. Quanto mais criativo e detalhado você for, melhor. Além disso, é o nosso melhor modelo de renderização de texto até o momento, o que foi um desafio para os modelos de geração de imagens.”

Diz-se que a capacidade do modelo de IA de entender dicas foi significativamente melhorada, agora permitindo que ele siga as dicas com precisão para capturar detalhes finos e gerar uma imagem fiel. Esta também parece ser uma direção comum para a maioria dos anúncios relacionados à IA no evento, já que a maioria dos modelos de IA agora são mais capazes de entender os prompts. O Google acrescentou que o Imagen 3 estará disponível em múltiplas versões, com cada modelo otimizado para um tipo específico de tarefa, desde a geração de esboços rápidos até a criação de imagens em alta resolução.

Para permitir que o Imagen 3 capture detalhes finos e instruções específicas, como ângulo da câmera ou composição em sugestões longas e complexas, o Google treinou o modelo de IA com imagens que contêm descrições detalhadas nas legendas, para que ele possa captar nuances ainda menores. Ele também pode gerar uma variedade de texturas e renderizar imagens de texto.

Pensando na segurança, cada imagem gerada pelo Imagen 3 incluirá uma marca d’água SynthID. Incorpora uma marca d’água digital diretamente nos pixels da imagem, impossibilitando sua remoção cortando, compartilhando ou fazendo qualquer alteração na imagem. Espera-se que o modelo de IA apareça em pré-visualização pública nos próximos meses. Atualmente, o Google está trabalhando para adicionar opções de edição de pintura interna e externa. Imagen 3 está atualmente disponível em visualização privada no ImageFX para criadores selecionados. Em breve estará disponível para clientes corporativos da gigante da tecnologia.


Links de afiliados podem ser gerados automaticamente – detalhes podem ser encontrados em nossa declaração de ética.

Encontre as últimas notícias e análises de tecnologia no Gadgets 360 X, Facebook, Whatsapp, Tópicos E Notícias do Google. Para vídeos mais recentes sobre gadgets e tecnologia, inscreva-se em nosso canal do Youtube. Se você quer saber tudo sobre os melhores influenciadores, acompanhe nossas informações privilegiadas Quem é esse360 SOBRE Instagram E YouTube.

Redmi K70 Ultra localizado no site de certificação 3C; Prevemos comprar MediaTek Dimensity 9300+ SoC



Fonte