CREACIÓN DE BASES DE DATOS PARA LA CLASIFICACIÓN GRAFO-FONÉMICA DE ESTRUCTURAS INGLESAS

Alumna investigadora: Cristina Otero del Real

Estudios: Grado en Estudios Ingleses. Facultad de Filosofía y Letras. Departamento de Filología Inglesa

Profesor/ tutor: Enrique Cámara Arenas

Resumen del proyecto:

El interés por la grafo-fonémica desde la investigación académica se centra principalmente en desarrollar herramientas para la enseñanza de la lectura y escritura en hablantes nativos. Sin embargo, creemos que esta materia puede proporcionarnos información estable y útil para la enseñanza de la pronunciación inglesa a hablantes no nativos de cualquier nacionalidad. El sistema de escritura del inglés, aunque complejo en sus correspondencias entre letra y sonido, es muy constante a lo largo de todas las variedades del idioma. A menudo los hablantes se encuentran con palabras cuya pronunciación no saben descifrar a partir de la escritura, puesto que carecen de las herramientas necesarias.

Este proyecto ha consistido en la creación de un programa en Python 3 para la elaboración de bases de datos con información grafo-fonémica a partir de 5000 palabras de una lista de frecuencia extraida del corpus COCA (Corpus of Contemporary American English). El programa permite la clasificación de estas palabras y de cualquier otra palabra introducida, creando una fórmula grafo-fonémica con los indicadores de pronunciación relevantes y extrayendo su pronunciación y patrón de tonicidad de un diccionario de pronunciación. Todo esto para la posterior clasificación, también automatizada, de cada palabra de acuerdo con las diferentes reglas generales de pronunciación establecidas, pudiendo aislar las palabras regulares de sus excepciones.

Sectores de aplicación:

Estudio analítico de la pronunciación inglesa. Estudio de la aplicación y regularidad de las reglas de pronunciación. Enseñanza de la pronunciación del inglés a hablantes no nativos

Objetivos alcanzados:

Hemos desarrollado un programa en Python 3 que clasifica las palabras de acuerdo con la regla de pronunciación aplicable en cada caso.

Metodología empleada:

Como datos hemos tomado una lista de 5000 palabras frecuentes extraída del corpus COCA y el diccionario de pronunciación Carnegie en su versión txt. Tras un tratamiento previo de los datos mediante el cual hemos seleccionado la información necesaria, hemos establecido un protocolo de substitución automático en Python por el cual el programa creara la fórmula grafo-fonémica de cada palabra de la lista. Pudiendo clasificar las palabras de acuerdo con las reglas aplicables y aislando las regulares de las excepciones.