Investing.com – Google anunció hoy el lanzamiento de Gemini 3.5 Live Translate, un modelo de audio que ofrece traducción de voz a voz en tiempo casi real en más de 70 idiomas. El modelo detecta automáticamente los idiomas y genera voz traducida preservando la entonación, el ritmo y el tono de los hablantes.
Gemini 3.5 Live Translate genera voz de forma continua en lugar de esperar a que los hablantes terminen antes de responder, manteniéndose unos pocos segundos por detrás del hablante durante las sesiones. El modelo procesa el habla a medida que se transmite y gestiona entradas multilingües sin necesidad de configuración manual. Google indicó que la robustez del modelo frente al ruido le permite funcionar en entornos ruidosos e impredecibles.
El modelo se despliega hoy en los productos de Google, incluyendo una vista previa pública para desarrolladores a través de la API de Gemini Live y Google AI Studio, una vista previa privada para empresas en Google Meet a partir de este mes, y a través de Google Translate en Android e iOS. Plataformas para desarrolladores como Agora, Fishjam, LiveKit, Pipecat y Vision Agents están integrando la tecnología para habilitar aplicaciones de traducción de voz.
Grab está probando el modelo para facilitar la comunicación multilingüe entre conductores y pasajeros durante los servicios de recogida. Los usuarios de la compañía realizan más de 10 millones de llamadas de voz al mes a través de Grab. Philipp Kandal, Director de Producto de Grab, señaló que la empresa valoraba la capacidad del modelo para detectar automáticamente múltiples idiomas y traducir el habla con precisión y baja latencia.
Google Meet utilizará Gemini 3.5 Live Translate para la traducción de voz, ofreciendo más de 70 idiomas en comparación con el límite anterior de cinco idiomas, y permitiendo conversaciones en más de 2.000 combinaciones de idiomas en una misma reunión. Todo el audio generado por el modelo lleva una marca de agua con SynthID, una marca imperceptible integrada en la salida de audio para ayudar a prevenir la desinformación.
