Translatotron: la nueva tecnología de Google

Hace una semanas, Google anunció una nueva herramienta de traducción simultánea: Translatotron. ¿Qué es? ¿Cómo funciona? ¿Para qué sirve? Aquí os damos algunas de las claves que ha proporcionado el gigante americano sobre su nueva tecnología.

Traducción de extremo a extremo

Google nos cuenta que la tecnología que posee Translatotron se basa en la traducción de extremo a extremo, mucho mejor que los sistemas en cascada que se han utilizado habitualmente. Esto permite que haya menos errores y que la construcciónde las oraciones sea más fluida. Además, cuenta con el añadido de que ya no es necesario, con la traducción de extremo a extremo, de la r epresentación gráfica del audio. Es decir, se pasa directamente del audio en la lengua origen al audio de la lengua meta, sin el paso previo del texto escrito.

Los primeros modelos de esta tecnología de traducción de extremo a extremo datan de 2016. Un año después, Google demostró que podían mejorar los resultados de la traducción en cascada.

Translatotron, una tecnología innovadora y mejorada

Este nuevo sistema, mucho más preciso que los anteriores, permite la traducción directa del audio en la lengua origen a la lengua meta. Se basa en el procesamiento de la voz a través de espectrogramas, utilizando para ello un vocoder neural que da forma al sonido de salida y que permite la opción de generar una voz similar al original si se entrena previamente el codificador.

Una de las cosas más sorprendente y que resulta más llamativa es el intento por emular la voz del emisor. En un intento por generar naturalidad, este sistema imita el tono de voz, el acento y la cadencia de la voz original y la trasvasa a la traducción. No podemos sino sorprendernos de un elemento tan innovador, ya que ningún traductor simultáneo presentaba hasta ahora estas características. Es una de las cosas que Google intenta mejorar, como podemos ver desde hace tiempo con su asistente de voz.

Además, presenta la ventaja de que puede evitar algunos errores de composiciones de las frases, que se daban en el antiguo modelo en cascada como consecuencia de los distintos pasas que tenía que realizarse para la traducción. También hay una mejora en el manejo de las palabras que no necesitan traducción, como los nombres propios.

Pero hay que seguir mejorando

Google ha compartido algunos ejemplos del uso de Translatotron. Aparecen ambos modelos, el modelo en cascada y el nuevo modelo de extremo a extremo, donde podemos analizar las diferencias que hay entre ellos. Asimismo, ha compartido más ejemplos en otra de sus páginas.

Aunque es un gran paso hacia adelante, Google es consciente de que tiene que seguir mejorando esta tecnología, en casos, por ejemplo, en los que el emisor hable muy bajo o no sepa expresar correctamente una idea, algo que es muy común. Sin duda, es un buen punto de partida para futuras investigaciones en este campo.

Pero, ¿ponen en riesgo Translatotron la labor de los intérpretes?

Aunque puede parecer que este tipo de tecnología supone un riesgo para los intérpretes, no están tan desarrollada como para que pueda sustituir a una persona. ¿Es posible que lo haga en un futuro? Nosotros siempre hemos sido, somos y seremos defensores de que, en términos lingüísticos, una máquina no puede sustituir a una persona. Con todo, deberemos esperar a que se siga avanzando en este tipo de investigaciones para saber si realmente son tan fiables como nos las plantean o siguen teniendo errores como las anteriores.