Google Omni: O que essa IA faz de verdade e como ela afeta seus vídeos
Sabe aquela história de transformar texto em imagem, ou imagem em vídeo, com um clique? O Google está apostando alto nisso com o Omni, a nova família de modelos de IA que promete ser o “faz-tudo” dos vídeos. A ideia é simples: você dá qualquer tipo de entrada (foto, vídeo, texto) e ele te entrega um vídeo. Mas será que funciona mesmo na prática?
Eu testei o Omni Flash, a primeira versão liberada, que está disponível na plataforma Flow do Google. Antes, a gente usava o Veo para gerar e editar vídeos com IA. O Omni chega com a promessa de ser melhor, mais consistente e com mais “conhecimento de mundo” para criar cenas mais realistas.
Para ver a real, resgatei meu “Buddy” de IA – um cervo de pelúcia que já tinha virado estrela de vídeo antes. A ideia era colocar ele em novas aventuras e ver como o Omni se saía. E, olha, os resultados são uma mistura bem doida.
Alguns vídeos ficaram muito bons, bem mais próximos do que eu pedi no prompt do que quando usei o Veo meses atrás. A consistência do personagem melhorou bastante. Mas, mesmo nos melhores momentos, a IA ainda dá uns “sustos”. Tipo o Buddy mudando de posição do nada enquanto está “saltando de paraquedas”.
Em outro teste, dei mais liberdade criativa para o Omni: “Crie uma montagem do Buddy arrumando as malas para uma viagem e embarcando em um cruzeiro tropical. O clima é fofo e divertido. Buddy coloca algo engraçado na mala que será usado depois no clipe.”
A IA fez o Buddy embalar um pote de mel. Mais tarde, ele pegava o pote como se fosse protetor solar e esguichava mel na pata. A cena em si foi até engraçada, mas o pote de mel mudava o tempo todo: de vidro para um frasco transparente com água, e depois voltava a ser um frasco de mel. E o final do vídeo? Parece que a IA “vomitou” um monte de elementos da sequência. Totalmente sem sentido.
Uma coisa que o Google melhorou foi a edição por texto. Com o Omni, você consegue sugerir mudanças nos vídeos usando prompts, e ele realmente leva em consideração. Com o Veo, era tão ruim que eu preferia começar um vídeo novo do zero. Mas ainda não é perfeito. Pedi para o Buddy ter mais expressões faciais e ele ficou com umas caras estranhas. E, de vez em quando, ele ganhava chifres, sendo que ele é um bebê cervo sem chifres! Quando pedi para remover os chifres de uma cena, ele tirou, mas adicionou em todas as outras. É de pirar!
E tem mais: tudo isso custa créditos. Gerar um vídeo pode sair entre 15 e 40 créditos, dependendo do tempo e dos “ingredientes” que você usa. Uma rodada de edição custa 40 créditos. Ou seja, não é de graça e você precisa gerenciar seus créditos com sabedoria. A ferramenta é poderosa, mas ainda tem um caminho a percorrer para ser realmente impecável e intuitiva para o uso diário.
Fonte: https://www.theverge.com/tech/936507/gemini-omni-hands-on-deepfake-ai-video


