Google I/O 2024: Google lança gerador de vídeo Veo AI e compete com Sora da OpenAI

A sessão de abertura do Google I/O 2024 durou 112 minutos, durante os quais a empresa fez vários anúncios importantes sobre inteligência artificial (IA). Os anúncios incluíram novos modelos de IA e integração de IA nos produtos do Google, mas talvez uma das apresentações mais interessantes tenha sido o Veo, um modelo de geração de vídeo alimentado por IA que pode gerar vídeos em 1080p. A gigante da tecnologia disse que a ferramenta de IA pode gerar vídeos com mais de um minuto. Vale ressaltar que em fevereiro a OpenAI também apresentou seu modelo de IA de vídeo denominado Sora.

Durante o evento Demis Hassabis cofundador e CEO do Google DeepMind expor Nós. Ao anunciar o modelo de IA, ele disse: “Hoje estou animado em anunciar nosso mais novo e poderoso modelo de vídeo generativo chamado Veo. Veo cria vídeos 1080p de alta qualidade com base em prompts de texto, imagem e vídeo. Ele pode capturar os detalhes das instruções em uma variedade de estilos visuais e de vídeo.

A gigante da tecnologia diz que o Veo pode seguir de perto as instruções para entender as nuances e o tom de uma frase e então gerar um vídeo que se assemelhe a essa frase. O modelo de IA pode gerar vídeos em uma variedade de estilos, como lapso de tempo, close-ups, fotos rápidas, fotos aéreas e várias fotos de iluminação e profundidade de campo. Além de gerar vídeo, o modelo de IA também pode editar vídeos, uma vez que o usuário fornece um vídeo inicial e uma solicitação para adicionar ou remover algo. Além disso, também pode gerar vídeos com mais de um minuto com um único prompt ou vários prompts consecutivos.

Para resolver o problema de consistência dos modelos de geração de vídeo, a Veo utiliza transformadores de difusão latente. Isso ajuda a reduzir ocorrências de personagens, objetos ou toda a cena oscilando, pulando ou mudando inesperadamente entre os quadros. O Google enfatizou que os vídeos criados pela Veo terão marca d’água usando SynthID, a ferramenta interna da empresa para colocar marca d’água e identificar conteúdo gerado por IA. O modelo estará disponível em breve para criadores selecionados por meio da ferramenta VideoFX no Google Labs.

Semelhanças do Veo com o Sora da OpenAI

Embora nenhum dos modelos de IA esteja disponível publicamente ainda, ambos têm várias semelhanças. Veo pode gerar vídeos 1080p por mais de um minuto, enquanto Sora OpenAI pode gerar vídeos de até 60 segundos. Ambos os modelos podem gerar vídeos a partir de prompts de texto, imagens e vídeos. Baseados em modelos de difusão, ambos são capazes de gerar vídeos de diversos ângulos, estilos e técnicas cinematográficas. Tanto Sora quanto Veo também vêm com rótulos de conteúdo gerados por IA. Sora usa o padrão Coalition for Content Provenance and Authenticity (C2PA), enquanto Veo usa seu SynthID nativo.


Links de afiliados podem ser gerados automaticamente – detalhes podem ser encontrados em nossa declaração de ética.

Fonte