Google DeepMind anuncia modelo de vídeo para competir com Sora da OpenAI
O Veo 2, sucessor do Veo, foi anunciado pela Google DeepMind com a promessa de gerar vídeos com mais de dois minutos de duração e resolução de até 4K. Isso representa quatro vezes a resolução e mais de seis vezes a duração alcançada atualmente pelo Sora, da OpenAI. No entanto, a versão do modelo disponível na plataforma VideoFX do Google ainda está limitada a vídeos em 720p e oito segundos de duração, enquanto o Sora pode produzir clipes em 1080p com até 20 segundos. O acesso ao VideoFX está sendo disponibilizado gradualmente por meio de uma lista de espera, mas o Google afirma que está expandindo o número de usuários.
Assim como seu antecessor, o Veo 2 gera vídeos a partir de prompts de texto e também pode utilizar imagens de referência. Segundo a DeepMind, a nova versão apresenta uma melhor compreensão de física e controle de câmeras, permitindo posicionamentos mais precisos para capturar objetos e pessoas de diferentes ângulos. Além disso, o modelo oferece texturas aprimoradas e imagens mais nítidas nos clipes gerados.
Outro destaque é a capacidade do Veo 2 de modelar com maior realismo o movimento, a dinâmica de fluidos — como o despejo de café em uma caneca —, e as propriedades de luz, incluindo sombras e reflexos.