Aproximación al reconocimiento voz-texto EN/ES aplicado a documentos audiovisuales: un estudio de caso | UVaINVESTIGA-Consejo Social de la Universidad de Valladolid

Alumna investigadora: María Otaño Jiménez

Departamento o Instituto Universitario: Departamento de Lengua Española.

Tareas realizadas:

Contextualizar los conceptos teóricos más importantes para el estudio
Establecer las herramientas de reconocimiento voz-texto y traducción
Establecer la muestra de análisis
Establecer los parámetros de análisis
Realizar el análisis
Categorizar los errores y establecer su tipología
Postedición
Extracción de resultados y conclusiones

Objetivos alcanzados:

Evaluar el potencial de los sistemas de reconocimiento de voz-texto y de la traducción automática de YouTube y determinar si pueden producir traducciones comparables a las realizadas por profesionales.
Determinar la importancia de los sistemas de reconocimiento de voz-texto y de la traducción automática por parte de YouTube, así como de los sistemas de Google.
Detectar, corregir y profundizar en la tipología de errores cometidos por el sistema de traducción automática de los subtítulos de YouTube.
Realizar una postedición de dicha traducción, teniendo en cuenta las restricciones que presenta el formato de los subtítulos

Sectores de aplicación:

Traducción e interpretación
Inteligencia artificial

Metodología utilizada:

Descarga de subtítulos en inglés y español
Comparación entre los subtítulos en inglés y el audio original para garantizar la correspondencia exacta entre ambos y poder generar la transcripción
Análisis de los subtítulos en inglés y español, detección y clasificación de los diferentes tipos de errores.
Elaboración de gráficos con resultados cuantitativos en porcentaje que han permitido identificar los tipos de errores más recurrentes.
Postedición manual de los subtítulos con el fin de obtener mayor precisión y calidad en la traducción teniendo en cuenta las limitaciones de esta técnica de traducción audiovisual.

Opinión sobre la experiencia investigadora desarrollada:

Durante el desarrollo de esta investigación, hemos tenido la oportunidad de aplicar y poner en práctica diversas competencias y habilidades que nos han permitido alcanzar los objetivos previstos. La realización de este proyecto ha requerido la comprensión de los fundamentos teóricos de la literatura previa, el desarrollo de una metodología de análisis precisa, la extracción y análisis de datos a partir de una muestra, y la capacidad de sintetizar y presentar la información de manera clara y precisa. Los
sistemas de traducción automática se aplican en muchos campos, entre los que se incluye la traducción de documentos oficiales, de textos en línea, de subtítulos para películas y series, de textos técnicos en campos como la medicina o la informática, etc. Los sistemas de reconocimiento de voz-texto son de gran ayuda para realizar transcripciones de conferencias y su posterior traducción y subtitulación, y pueden ser especialmente útiles a la hora traducir grandes cantidades de textos o documentos audiovisuales de manera rápida y eficiente.

Apoyo a la difusión de la actividad investigadora de la Universidad de Valladolid