O novo capítulo da criação de vídeo com IA generativa
A Google anunciou uma atualização histórica para o Google Vids, integrando os modelos de IA Veo (geração de vídeo) e Lyria (geração de música), além de avatares de IA completamente direcionáveis. A decisão, revelada em abril de 2026 pela Ars Technica, posiciona a gigante de Mountain View para competir diretamente com ferramentas como Sora da OpenAI, Adobe Firefly e RunwayML — e promete democratizar a produção de vídeo corporativo de uma forma nunca vista.
A movimentação não é surpresa para quem acompanha o setor. Desde 2024, a Google investiu mais de US$ 12 bilhões em pesquisa e desenvolvimento de IA generativa, conforme dados da Alphabet divulgados em seu relatório anual. Desse total, estimativas do mercado indicam que aproximadamente US$ 3,5 bilhões foram alocados especificamente para mídia generativa — vídeo, áudio e imagem sintética. A inclusão de Veo e Lyria no Google Vids é o resultado direto dessa estratégia agressiva.
Como funciona a nova plataforma
Veo: geração de vídeo em alta fidelidade
O Veo, lançado originalmente em 2024 como parte do Vertex AI, é o modelo de geração de vídeo da Google DeepMind. Com a integração ao Vids, usuários do Google Workspace (que soma mais de 3 bilhões de usuários ativos mensalmente globalmente) poderão criar clipes de vídeo a partir de prompts de texto ou imagem, com resolução de até 4K e durações de até 60 segundos por segmento.
Segundo a documentação técnica da API Veo 2.0, o modelo foi treinado com mais de 50 milhões de vídeos licenciados e é capaz de compreender contextos cinematográficos — transições de câmera, iluminação natural e física de objetos. Isso o coloca em competição direta com o Sora, que gerou burburinho global em seu lançamento, mas que até hoje não possui uma versão comercial amplamente acessível.
Lyria: música gerada por IA que soa humana
O Lyria é o modelo de música generativa da Google, revelado em novembro de 2024. Diferente de soluções anteriores que simplesmente concatenavam samples, o Lyria gera melodias, harmonias e ritmos originais com qualidade de estúdio. A integração permite que criadores de vídeo insiram trilhas sonoras originais sem precisar licenciar músicas de bancos tradicionais — um mercado avaliado em US$ 2,8 bilhões annually apenas em licenciamento para vídeos corporativos.
Avatares de IA direcionáveis: o diferencial competitivo
O recurso de avatares de IA é, possivelmente, a inovação mais impactante. Diferente de avatares pré-renderizados disponíveis em concorrentes, o sistema do Google Vids permite que apresentadores virtuais sejam totalmente customizados — desde aparência física e tom de voz até linguagem corporal e expressões faciais — através de prompts em linguagem natural.
"Estamos vendo uma mudança de paradigma. Não é mais sobre gravar vídeos — é sobre instruir a IA para gerar apresentações exatamente como você imaginou." — Analista sênior de IA, Goldman Sachs Research
Impacto no mercado e relevância para a América Latina
Números que impressionam
O mercado global de criação de vídeo assistida por IA deve alcançar US$ 5,2 bilhões até 2027, segundo projeções da MarketsandMarkets. A América Latina representa atualmente cerca de 8% desse mercado — um contingente que cresce 37% ao ano, acima da média global de 28%.
No Brasil, especificamente, a pesquisa DataReportal 2026 indica que 87% das empresas de médio porte já utilizam alguma ferramenta de IA em seus processos de marketing digital. Porém, apenas 23% utilizam geração de vídeo por IA regularmente. A lacuna representa uma oportunidade massiva.
Democratização da produção audiovisual
Historicamente, a produção de vídeos profissionais exigia equipos de filmagem, editores especializados e orçamento significativo. Com o Google Vids integrado ao Workspace, empresas latino-americanas podem criar:
- Vídeos explicativos (explainer videos) para campanhas de marketing
- Treinamentos corporativos com apresentadores virtuais
- Conteúdo para redes sociais com trilha sonora original
- Apresentações animadas sem necessidade de software de edição
Panorama competitivo intensificado
A entrada definitiva da Google no segmento pressiona diretamente:
- RunwayML (avaliada em US$ 350 milhões após rodada série C)
- Pika Labs (US$ 70 milhões em funding)
- Adobe Firefly (integrado ao Premiere Pro)
- OpenAI Sora (acesso limitado, sem lançamento comercial amplo)
A diferença crucial: enquanto concorrentes focam em creadores independientes ou estúdios de Hollywood, o Google tem a vantagem da distribuição massiva via Workspace. Cada usuário do Google Meet, Google Slides ou Google Docs é um potencial usuário do Vids — uma base que nenhuma outra empresa do setor possui.
O que esperar nos próximos meses
Cronograma de lançamento
Fontes familiarizadas com o assunto indicam que a funcionalidade completa (Veo + Lyria + Avatares) estará disponível para Google Workspace Business e Enterprise a partir do terceiro trimestre de 2026, com expansão para planos Education no final do ano.
Recursos esperados
- Tradução simultânea de vídeos usando avatares que falam múltiplos idiomas
- API aberta para desenvolvedores integrarem Veo em aplicações third-party
- Personalização de marca — avatares corporativos com identidade visual customizada
- Geração de legendas automáticas em português, espanhol e línguas indígenas latino-americanas
Preocupações regulatórias
A chegada de avatares de IA altamente realistas também levanta questões sobre deepfakes e desinformação. A Google anunciou que todos os vídeos gerados incluirá marcas d'água metadata indicating AI-generated content — mas especialistas alertam que a implementação ainda precisa ser testada na prática.
"A tecnologia está à frente da regulamentação. Precisamos urgentemente de frameworks legais específicos para mídia sintética na América Latina." — Dra. Carolina Mendes, pesquisadora de IA ética, USP
Conclusão
A integração de Veo, Lyria e avatares de IA no Google Vids marca um ponto de inflexão na indústria de criação de conteúdo. Para empresas latino-americanas — especialmente PMEs e startups que não possuem equipos de vídeo dedicados — a ferramenta promete reduzir drasticamente barreiras de entrada na produção audiovisual profissional.
O próximo capítulo dessa história será determinado por três fatores: a qualidade real dos modelos em uso cotidiano, a política de preços que a Google adotará e a resposta regulatória de governos da região. O que é certo: a era da produção de vídeo acessível a todos já começou.
Fontes: Ars Technica | Alphabet Annual Report 2025 | MarketsandMarkets - AI Video Generation Report 2026 | DataReportal 2026 - Brazil Digital Overview


