DETECCIÓN DE INSTRUMENTAL QUIRÚRGICO EN IMÁGENES DE CIRUGÍA LAPAROSCÓPICA EMPLEANDO REDES NEURONALES CONVOLUCIONALES

Alumno investigador: Alejandro Egido López

Estudios: Grado en Ingeniería en Electrónica Industrial y Automática. Departamento de Ingeniería de Sistemas y Automática. Escuela de Ingenierías Industriales

Profesor/tutor: Eusebio de la Fuente López

Resumen del proyecto:

La inteligencia artificial es el área de investigación de la computación que más está despuntando en los últimos años. En este proyecto se plantea la detección de instrumental quirúrgico, más concretamente de gasas, mediante visión artificial y redes neuronales convolucionales.
Para ello, se ha empleado el modelo Mask-R-CNN, el cual se utiliza para la segmentación de imágenes, es decir, los pixeles correspondientes a un objeto determinado. Debido a la complejidad de dicho modelo, se ha usado una red ya entrenada previamente para la detección de núcleos de células. Dicho modelo se ha reentrenado con un dataset formado por conjunto de imágenes que contienen gasas emulando lo que aparecería en una cirugía real y sus máscaras correspondientes que indican la posición de la gasa.
Este proyecto se ha realizado como continuación a la labor realizada por Guillermo Sánchez, becario del curso anterior.

Objetivos alcanzados:

Se ha logrado la segmentación correcta de las gasas en la mayor parte de los casos en imágenes de validación, es decir, en aquellas que no han sido utilizadas previamente en el entrenamiento y cuya ubicación desconoce a priori la red convolucional.

Sectores de aplicación:

Este proyecto de investigación se ha realizado en el ámbito del Deep Learning y la Visión Artificial. Sin embargo, su principal aplicación es el ámbito de la medicina, como apoyo al cirujano en una cirugía laparoscópica, donde la visibilidad de las herramientas suele ser muy reducida.

Metodología empleada:

En primer lugar, se ha modificado la estructura del dataset existente para adaptarlo a la del modelo que se ha usado.
Después, se han generado imágenes nuevas a partir de las existentes mediante técnicas de augmentación con la librería Albumentation, como pueden ser giros, espejos, añadir borrosidad debido al movimiento, etc. De esta forma, se produce un dataset más amplio que mejore el entrenamiento con imágenes que pudieran darse en el caso real.
A continuación, se han realizado varias pruebas de reentrenamiento del modelo de red neuronal con dicho dataset con las librerías TensorFlow y Keras del lenguaje de programación Python. En dichas pruebas se han configurado los hiperparámetros de entrenamiento para lograr el resultado óptimo.