grw-briefing-intro
¿Es tan buena la inteligencia artificial para traducción, subtitulación y voz en off?
La traducción automática y la transcripción de voz a texto con inteligencia artificial (IA) es un tema tan candente que los gigantes de la tecnología están invirtiendo fuertemente en ello y anuncian cada cierto tiempo haber alcanzado un nuevo hito en la tasa de error de palabras (WER).
Hemos formado un equipo con la empresa emergente francesa MediaWen para comprobar por nosotros mismos lo bien que funciona la IA en este ámbito. Gracias a la combinación de soluciones de vanguardia de los grandes actores en este campo (Google, Microsoft e IBM) con las mejores soluciones basadas en investigación y sus propios algoritmos, MediaWen consigue mejorar los resultados.
Hemos probado seis vídeos:
- Dos vídeos sobre estudios de investigación, utilizando dos opciones diferentes de captación de sonido (oficina/conferencia) Traducción del francés y del inglés (con hablante francés en ambos casos)
- Dos píldoras formativas sobre gestión del conocimiento (las soluciones de MediaWen, conformes al estándar SCORM, se utilizan a menudo en este tipo de vídeos)
- Dos vídeos dentro de una partida (in-game) del juego GRW (Ghost Recon Wildlands): una secuencia cinematográfica y una secuencia de experiencia de juego.
Se aplicó la transcripción de voz a texto a los seis vídeos y la traducción automática a todos excepto a la secuencia de experiencia de juego de GRW; en la cual, debido a la mezcla de sonidos, música y voces, la IA no funcionó muy bien, y esto confirma nuestro presentimiento de que cada archivo de sonido debe ser traducido de manera individual. En ambos casos —transcripción de voz a texto y traducción— probamos herramientas de Google, Microsoft, IBM y Voxolab y seleccionamos en cada caso la que proporcionaba mejores resultados.
El resultado variaba dependiendo de si era transcripción de voz a texto o traducción y de la dirección de las lenguas de traducción. A continuación, un traductor humano corrigió el resultado obtenido tras aplicar la IA. MediaWen mostró todas las correcciones realizadas según su tipo y de ello se dedujo que algunos resultados requerían mucha más intervención humana que otros.
Con un espíritu de total transparencia, todos los vídeos procesados están disponibles a continuación. Basta con hacer clic en las miniaturas e iniciar la reproducción del vídeo. El icono de la bola del mundo del reproductor de vídeo muestra un menú que permite navegar a través de varias pruebas de transcripción de voz a texto, traducción y voz en off.