Resumen:
El proyecto propone evaluar el desempeño de un algoritmo SLAM visual de visión artificial para entornos dinámicos que permita la evaluación y reconstrucción de trayectorias con presencia de perturbaciones dinámicas.
El punto de interés en este proyecto es la evaluación de la integración de un sistema vSLAM que combine el algoritmo de seguimiento ORB-SLAM con el uso de filtros de movimiento, y la inclusión de una red de segmentación semántica, utilizando una base de datos pública denominada TUM RGB-D, específicamente la sección de videos en interiores con presencia dinámica, para así poder evaluar el desempeño de esta integración.
El desarrollo del algoritmo ha sido implementado en el lenguaje Matlab usando las herramientas de visión artificial pertenecientes al software. Se recurre al lenguaje Python para la evaluación de los datos estimados en Matlab contra los suministrados por la base de datos para la evaluación.
En el presente trabajo se implementó un algoritmo ORB-SLAM con filtros, ajustes de poses, ajustes de movimiento y finalmente una reproducción del algoritmo con la adición de una red neuronal para segmentación semántica MASK-RCNN con el fin de evaluar la incidencia de la segmentación semántica en la reconstrucción de trayectorias con escenas dinámicas; es necesario aclarar que el algoritmo base ORB-SLAM es tomado directamente de la plataforma virtual de Matlab, denominada mathworks, donde se implementan numerosos algoritmos de patente abierta para pruebas educativas, así como también se extrajo de esta misma manera el recurso correspondiente a la red de segmentación semántica pre-entrenada (MASK-RCNN) para la detección de clases como personas y vehículos; por tanto se identifica como objetivo principal de este trabajo la integración y adaptación de estas dos partes con la finalidad de evaluar los resultados de esta unión durante la reconstrucción de la trayectoria de un objeto situado en un entorno interior con la incidencia de objetos dinámicos. Para corroborar la efectividad de la integración del algoritmo propuesto, este se evalúa sobre seis secuencias de imágenes con diferentes estándares dinámicos comparando los resultados del sistema con y sin la incidencia del método de segmentación semántica; el algoritmo con segmentación presenta mejoras en la evaluación que contiene alta presencia dinámica, sin embargo en ocasiones no se hace suficiente, presentando fallas en el cierre de mapa para obtener los resultados, esto debido a que hay variaciones bruscas en la exposición luminosa capturada o en la dinámica del sistema, que imposibilita la obtención de características necesarias para continuar la ejecución del sistema.