Meta afirma que está creando un sistema universal de traducción de voz impulsado por la IA que ofrece traducción de voz a voz en tiempo real para cientos de idiomas.
Meta está construyendo un traductor de voz universal impulsado por la IA que pretende ofrecer traducciones de voz a voz en tiempo real para cientos de idiomas. La traducción de idiomas no es una tarea fácil, e incluso soluciones dedicadas como PocketTalk y Langogo Genesis tienen sus propios límites en términos de alcance lingüístico, velocidad y medio de traducción.
Google Translate es uno de los sistemas de traducción más utilizados, pero cuando se trata de idiomas muy diferentes al inglés, las traducciones pueden resultar un popurrí de frases apenas comprensibles. Funciona, pero está lejos de ser perfecto. Google hizo algunas olas el año pasado cuando introdujo la traducción de voz a voz en la serie de teléfonos Pixel 6. Fue un enorme salto adelante en términos de precisión y entonación, pero todavía no es una herramienta de traducción de voz a voz en tiempo real.
Meta ha anunciado planes para crear un sistema de traducción de voz a voz impulsado por la IA que puede manejar cientos de idiomas. El proyecto de traducción de Meta pretende abarcar incluso las lenguas que carecen de un sistema de escritura sistemático y sólo existen en forma oral. Esto será de gran valor, especialmente para las lenguas indígenas que están desapareciendo rápidamente. Según el Atlas de las Lenguas en Peligro de la UNESCO, de las 6.700 lenguas que se hablan actualmente en todo el mundo, el 40 por ciento de ellas corre el riesgo de desaparecer para siempre. Otro informe de Naciones Unidas de 2019 señala que cada mes desaparecen dos lenguas indígenas de forma permanente. Meta dice que los modelos de traducción existentes se basan en el texto como intermediario, lo que hace que todo el proceso sea menos eficiente y difícil de escalar. Además, es poco útil para las lenguas que solo existen en forma oral.
Construir algo bueno, para variar
Para superar este obstáculo, Meta se centrará en los modelos de traducción de voz a voz, de modo que las lenguas que no tienen un sistema de escritura estandarizado también puedan entrar en el redil. Meta ha ideado una técnica de creación de conjuntos de datos denominada LASER y un nuevo método de formación de profesores y alumnos que maneja varios idiomas simultáneamente al organizarlos en grupos basados en similitudes lingüísticas. Se dice que el sistema es capaz de realizar traducciones de voz a texto y de voz a voz en idiomas como el inglés, el alemán y el español. Con el fin de ampliar el alcance de su modelo de formación para abarcar tantos idiomas, Meta también afirma haber desarrollado el primer sistema de traducción de texto multilingüe que no se centra totalmente en el idioma inglés. La idea es que un sistema de traducción de voz a voz deje de tener un tercer idioma intermediario en el proceso.
"Con una eficiencia mejorada y una arquitectura más sencilla, la traducción directa de voz a voz podría dar lugar a una traducción de calidad casi humana en tiempo real para futuros dispositivos, como las gafas de realidad aumentada", afirma la empresa. En lo que respecta a la evaluación del rendimiento y la fiabilidad, Meta afirma que los tiene cubiertos con conjuntos de datos de evaluación de la traducción multilingüe denominados FLORES-101, que abarcan 101 idiomas. Sin embargo, Meta también es consciente de los obstáculos como la parcialidad, la toxicidad y las sensibilidades culturales, cuestiones con las que lleva tiempo lidiando en las redes sociales. En cuanto a la implementación, Meta cree que su Traductor Universal de Voz puede incluirse en una amplia gama de dispositivos, como teléfonos inteligentes, relojes inteligentes y gafas de realidad aumentada. Según los informes, Facebook está trabajando en un reloj inteligente y en unas gafas de realidad aumentada, por lo que no es de extrañar que Meta se esfuerce tanto.