Home Técnica Gemini 3.5 Live Translate de Google está diseñado para conversaciones de la...

Gemini 3.5 Live Translate de Google está diseñado para conversaciones de la vida real

16

Una nueva herramienta de inteligencia artificial de Google puede traducir a una velocidad de conversación real, lo que le permitirá hablar de forma más natural con hablantes de un idioma diferente al suyo.

Google presentado el martes Traducción en vivo de Géminis 3.5Un nuevo modelo de audio está diseñado para hacer que las conversaciones multilingües en tiempo real se sientan más naturales. A diferencia de los métodos de traducción tradicionales que procesan el habla a su vez, Géminis 3.5 Live Translate escucha, traduce y habla continuamente, lo que permite que las conversaciones fluyan con solo unos segundos de retraso para imitar patrones de habla normales.

El modelo detecta automáticamente los idiomas hablados y admite más de 70 idiomas, lo que permite miles de pares de idiomas dentro de la misma conversación. Google dice que la tecnología ahora está disponible para desarrolladores y socios, quienes pueden integrarla en reuniones, plataformas de comunicaciones y aplicaciones móviles.

Leer más: Las herramientas de aprendizaje y traducción en vivo de IA de Google están aquí Cómo usarlas

Novedades del Traductor en vivo Gemini 3.5

El mayor cambio es cómo se realiza la traducción. En lugar de esperar a que un orador termine antes de generar una respuesta, Gemini 3.5 Live Translate realiza una traducción en streaming continuo. El resultado es una experiencia de conversación más fluida con menos pausas, interrupciones y retrasos incómodos.

Atlas de IA

El modelo está construido para la realidad de la comunicación cotidiana. Google dice que puede funcionar en ambientes ruidosos y que está diseñado para manejar ruido de fondo, voces superpuestas y patrones de habla informales. Esto lo hace adecuado para una amplia gama de casos de uso, incluidas llamadas de atención al cliente, visitas guiadas, aulas, servicios de viajes compartidos y transmisiones en vivo.

Google también está haciendo hincapié en la calidad del habla. En lugar de crear una voz sintética genérica, el sistema intenta preservar elementos de la voz original del hablante, incluido el ritmo, la entonación y el tono emocional. Esto ayuda a que el discurso traducido suene más natural y hace que la conversación sea más fácil de seguir.

El objetivo más amplio es sacar la traducción en vivo del programa ocasional y pasarla a la comunicación cotidiana. Al permitir conversaciones multilingües casi en tiempo real sin la necesidad de cambiar la forma en que hablan los hablantes, Gemini 3.5 Live Translate puede hacer que las interacciones entre idiomas sean más prácticas para empresas, organizaciones e individuos por igual.

Leer más: Google Translate lleva la traducción en vivo con auriculares a dispositivos Apple

Enlace fuente