Google vai acabar com vozes do Gemini? Mudança chega em breve
modelos6 de maio de 20266 min de leitura0

Google vai acabar com vozes do Gemini? Mudança chega em breve

Google prepara eliminação das vozes do Gemini e substitui por novo sistema. Entenda as mudanças, cronograma e impacto para América Latina.

R

RADARDEIA

Redação

#Gemini Live#Google Assistant#voz IA#GPT-4o#OpenAI#síntese vocal#América Latina

Google prepara revolução nas vozes do Gemini: o que está mudando e por que importa

O Google está prestes a eliminar todas as vozes existentes do Gemini e substituí-las por um novo conjunto de opções de áudio. A revelação, feita pelo Android Authority após análise detalhada do código do aplicativo do Google, indica que a empresa já trabalha em uma nova identidade sonora para sua inteligência artificial. A mudança representa a maior reformulação no sistema de voz do Gemini desde seu lançamento, em 2023, e pode transformar fundamentalmente a experiência de interação com o assistente de IA do gigante de Mountain View.


Como chegamos aqui: a evolução das vozes do Google Assistant

Para compreender a magnitude desta mudança, é necessário entender a trajetória do assistente de voz do Google. O Google Assistant foi lançado em 2016 como evolução do Google Now, introduzindo vozes sintéticas mais naturais que representaram um salto tecnológico significativo na época. Em 2021, a empresa começou a implementar vozes com tom mais conversacional e expressivo, preparando o terreno para a integração com tecnologias generativas.

A transição para o Gemini — renomeado do Bard em fevereiro de 2024 — marcou uma mudança estratégica fundamental. O Google abandonou progressivamente a arquitetura original do Assistant para priorizar modelos de linguagem grandes (LLMs) mais sofisticados. Atualmente, o Gemini Live serve como a interface de voz principal do assistente, oferecendo conversas em tempo real que representam um contraste dramático com os comandos limitados do Assistant tradicional.

A análise de código conduzida pelo Android Authority revela vestígios de um projeto interno chamado internamente de "Aurora" — um sistema de síntese de voz completamente redesenhado. Os indícios sugerem que todas as 10 vozes actuales do Gemini serão descontinuadas em favor de novas opções que prometem maior naturalidade e variação emocional.


O que a mudança significa tecnicamente

Segundo as fontes consultadas pelo Android Authority, o novo sistema de vozes do Google Gemini representa uma quebra tecnológica com a arquitetura anterior. As vozes atuais utilizam um sistema de síntese que, apesar de competente, ainda apresenta limitações perceptíveis em termos de entonação e pausas naturais.

As principais características do novo sistema incluem:

  • Modelos de voz baseados em IA generativa, capazes de adaptar o tom e ritmo de fala ao contexto da conversa
  • Variação emocional mais sofisticada, respondendo ao teor emocional das interações do usuário
  • Latência reduzida na resposta de voz, aproximando-se do tempo de resposta em conversas humanas
  • Suporte a mais idiomas e sotaques, crucial para mercados como América Latina onde variantes regionais são determinantes

Especialistas do setor apontam que esta mudança posiciona o Google para competir mais diretamente com o GPT-4o da OpenAI, que recentemente lançou capacidades de voz com resposta em tempo real e tom altamente expressivo. A competição no segmento de assistentes de IA com voz natural tem se intensificado, com empresas investindo centenas de milhões de dólares em síntese vocal.


Impacto no mercado e relevância para América Latina

O mercado global de assistentes de voz com IA está projetado para alcançar US$ 14,7 bilhões até 2029, segundo dados da MarketsandMarkets. O segmento de voz representa um campo de batalha estratégico, onde empresas competem para criar a experiência mais natural e envolvente possível. Para o Google, atualizar o sistema de vozes do Gemini não é apenas uma melhoria técnica — é uma jogada competitiva essencial.

Para a América Latina, esta mudança carrega implicações particularmente significativas. A região abriga mais de 660 milhões de habitantes, com taxas de adoção de assistentes de voz acima da média global em mercados como Brasil e México. O português brasileiro e o espanhol latino-americano apresentam desafios fonéticos complexos que frequentemente resultam em experiências de usuário inferiores quando comparadas ao inglês.

"A capacidade de um assistente de IA entender e se expressar no sotaque local é determinante para a adoção em mercados latino-americanos. Uma voz mal calibrada para o português brasileiro, por exemplo, pode destruir a confiança do usuário em segundos", explica Marina Santos, pesquisadora de interface humano-computador da USP.

O Google possui aproximadamente 31% do mercado de buscas na América Latina via dispositivos móveis, segundo dados da Statcounter. Manter a competitividade no segmento de voz é essencial para preservar essa posição diante de rivais como a Apple, que recentemente expandiu as capacidades do Siri para espanhol latino-americano.


O que esperar: cronograma e implicações futuras

Com base na análise de código e em fontes familiarizadas com os planos da empresa, espera-se que o novo sistema de vozes do Gemini seja lançado em fases ao longo de 2025. Inicialmente, as novas vozes devem estar disponíveis apenas em inglês, seguindo o padrão histórico de lançamento do Google que prioriza mercados anglófonos.

A implementação para português brasileiro e espanhol latino-americano deve ocorrer entre o terceiro e quarto trimestre de 2025, embora datas possam sofrer alterações. Usuários dos mercados latino-americanos devem ficar atentos a atualizações do aplicativo Google, que tradicionalmente distribuem novas funcionalidades de IA de forma gradual.

Para desenvolvedores e empresas que integraram o Gemini em seus produtos, a mudança exigirá testes extensivos. A API de voz do Gemini é amplamente utilizada em aplicações de atendimento ao cliente, educação e acessibilidade na região. Uma transição mal gerenciada pode afetar milhões de interações diárias.


Conclusão

A reformulação do sistema de vozes do Gemini representa mais do que uma atualização cosmética — sinaliza a intenção do Google de competir agressivamente no segmento de IA conversacional avançada. Para América Latina, onde a interação por voz com dispositivos móveis predomina, esta mudança pode definir padrões de experiência de usuário para os próximos anos. A questão central não é se a mudança ocurrerá, mas quando e como o Google gerenciará a transição para não perder terreno em um dos mercados mais dinâmicos para tecnologia de consumo no mundo.

FONTES: Android Authority, Canaltech, MarketsandMarkets, Statcounter

Leia também

Aulas de IA

Aprenda IA aplicada

Domine as ferramentas de IA com cursos práticos em português.

Ver cursos

Fonte: Canaltech

Gostou deste artigo?

Artigos Relacionados