Estudio de la estructuración modular de un sistema de visión artificial basado en redes neuronales

Autor: Zorzano Martínez, José María

Tipo de documento: Tesis

Director/es: Buldain Pérez, Julio David ; 

Universidad: Universidad de La Rioja

Año: 2008 

Resumen: La Tesis doctoral que se presenta se enmarca dentro de las áreas de trabajo de visión por computador y de redes neuronales artificiales, realizando la combinación de ambas áreas de trabajo. Se propone un sistema generalizado y simple basado en redes neuronales para realizar los tratamientos que se realizan en visión por computador. El sistema estaría formado por un conjunto de fases sucesivas y cada fase se construiría con una o varias redes neuronales, permitiendo realizar las funciones lineales y no lineales que se realizan en todo proceso de visión por computador. Las ventajas que se obtienen son las propias de las redes neuronales, tanto en los procesos de aprendizaje y de reconocimiento, como en la implementación de tipo paralelo, permitiendo reducir los tiempos de ejecución. Estas herramientas neuronales proporcionan una implementación modular, pues una misma estructura de red realizará múltiples funciones con sólo cambiar los valores de sus pesos, lo que las convierte en candidatas ideales para ser realizadas en "hardware". Por otra parte, su elevada capacidad de representación permite que se puedan pasar procesamientos no lineales secuenciales, como son los procesos morfológicos realizados en una serie de etapas, a procesos realizados en paralelo. Como aproximadores funcionales se propone utilizar Redes Neuronales Artificiales (RNA) supervisadas, tales como el Perceptrón Multicapa (MultiLayer Perceptrón, MLP). Las redes MLP pueden generar aproximadores de funciones generalizados, permitiendo aprender y reconocer funciones matemáticas que se aplican en visión por computador, así como funciones generales no conocidas por el usuario. El sistema utilizaría módulos neuronales diferentes según las necesidades con las que se encontrara en función de las características del escenario. El propio sistema se adaptaría escogiendo los módulos que necesitara y el orden adecuado con el objetivo que los resultados fueran óptimos. En la presente Tesis, se estudia y se analiza la posibilidad de poder crear un procesador generalizado neuronal estándar MLP con una sola capa oculta y con un número de neuronas ocultas que no sea excesivo, permitiendo realizar todo el conjunto de operaciones de visión artificial lineales y no lineales así como otras de tipo general. En la tesis se analizan dos estructuras diferentes según sean operaciones puntuales directamente sobre la imagen, caso de preprocesamiento, y operaciones locales con entorno de 3x3 sobre las imágenes. Para las operaciones puntuales se analizan siete funciones diferentes y para las operaciones locales se estudian 30 funciones, entre las que se encuentran detectores de bordes, filtrados lineales y no lineales, detector de líneas, operadores morfológicos, etc. El trabajo se realiza en imágenes de gris, aunque se pueden extrapolar a imágenes en color y simplificar a imágenes binarias. El proceso puede ampliarse a imágenes multiespectrales como es el caso de imágenes médicas, o videos que se interpretarían como imágenes sucesivas en el tiempo.