Metodología para el análisis de expresiones génicas utilizando modelos de señales oscilatorias. Aplicación a datos de músculo humano

Alumno investigador: Samuel Sjur Bassols Cítores

Departamento o Instituto Universitario: Departamento de Estadística e Investigación Operativa.

Tareas realizadas:

-Revisión del estado del arte: métodos de estimación del orden temporal, modelos matemáticos para el análisis de señales oscilatorias, clustering de datos funcionales y enriquecimiento funcional.
-Diseño de una metodología completa para la obtención del orden temporal, detección de genes rítmicos a partir de modelos de señales oscilatorias y para la clasificación de genes rítmicos en función de su forma y estudio de sus características.
-Comparación de distintas metodologías para afrontar el problema mediante datos generados artificialmente.
-Lectura, preprocesado y análisis de los datos de la base de datos Genotype-Tissue Expression (GTEX).
-Desarrollo y validación de la metodología estadística e implementación de software.
-Explotación de los resultados y elaboración de una memoria que recoge las tareas realizadas.
Esta memoria se ha presentado como TFG en el Grado en Estadística.

Objetivos alcanzados:

Se ha propuesto un algoritmo para abordar el problema de la identificación de genes rítmicos a partir de datos de expresión. La solución al problema completo ha requerido del desarrollo de metodología para resolver el problema del orden temporal y de la identificación y análisis de expresiones rítmicas. Para diseñar este algoritmo se han comparado varias metodologías mediante datos simulados.
Se ha aplicado el algoritmo a datos del tejido músculo esquelético en la base de datos GTEX. Se han identificado 2438 genes rítmicos y, utilizando clustering funcional se han definido 6 grupos de genes atendiendo a su patrón de ritmicidad. Utilizando herramientas de enriquecimiento funcional se ha comprobado la coherencia biológica de los genes/grupos de genes identificados.
Se ha desarrollado el software necesario para alcanzar los objetivos propuestos.

Sectores de aplicación:

El estudio y detección de la ritmicidad de genes cíclicos es de gran interés para la investigación básica en el campo de la cronobiología.
El estudio de estos genes puede ayudar a la detección y prevención de patologías en órganos y tejidos cuando se detecta una alteración en dicha ritmicidad. Esto podría conducir a grandes avances en los sectores de la telemedicina y la medicina personalizada.

Metodología utilizada:

-Trabajo con órdenes circulares y estimación del problema del orden circular mediante las metodologías Análisis de Componentes Principales Circulares (CPCA), CPCA mediante una red neuronal auto asociativa y aproximación a partir del Travelling Salesman problem (TSP).
-Modelización de una señal oscilatoria mediante el modelo paramétrico Frequency Modulated Möbius (FMM).
-Clustering de los genes cíclicos mediante Análisis de Componentes Principales Funcionales (FPCA) y k-medoids.
-Enriquecimiento funcional mediante la técnica de Gene Set Enrichment Analysis (GSEA).

Opinión sobre la experiencia investigadora desarrollada:

Este proyecto de colaboración me ha permitido adentrarme en el fascinante mundo de la investigación, profundizando en un tema actual, relevante y de gran interés, especialmente porque se han utilizado conceptos estudiados durante el grado universitario en un contexto
práctico y aplicado. La experiencia ha sido muy positiva también gracias al interés, apoyo e inestimable ayuda ofrecida por mis tutoras.