Repositorio Universidad del Cauca

Estudio comparativo de algoritmos de visión computacional orientados al reconocimiento de caídas

Mostrar el registro sencillo del ítem

dc.contributor.author Eraso Guerrero, José Camilo
dc.date.accessioned 2023-10-26T21:14:41Z
dc.date.available 2023-10-26T21:14:41Z
dc.date.issued 2022
dc.identifier.uri http://repositorio.unicauca.edu.co:8080/xmlui/handle/123456789/8577
dc.description.abstract En los últimos años, el reconocimiento de actividades humanas se ha convertido en un área de constante exploración en diferentes campos. Este trabajo incluye una revisión de la literatura enfocada en diferentes tipos de actividades humanas y dispositivos de adquisición de información para el reconocimiento de actividades, y profundiza en la detección de caídas de personas de tercera edad por medio de visión computacional, utilizando métodos de extracción de características y técnicas de inteligencia artificial, como redes neuronales convolucionales, dando a conocer la importancia del reconocimiento de caídas humanas en personas de la tercera edad, además de permitir encontrar aquellos factores que dificultan el verdadero avance en el área, como lo son las bases de datos disponibles, las cuales contienen elementos excesivamente controlados. Por lo anterior, como parte de la presente investigación, los autores crean CAUCAFall, una base de datos con 10 participantes, que simulan cinco tipos de caídas y cinco tipos de actividades de la vida diaria (AVD). En concreto, los datos incluyen caídas hacia delante, caídas hacia atrás, caídas laterales hacia la izquierda, caídas laterales hacia la derecha y caídas producidas al sentarse. Los participantes realizaron las siguientes AVD: caminar, saltar, coger un objeto, sentarse y arrodillarse. El conjunto de datos considera individuos de diferentes edades, pesos, alturas y piernas dominantes. Los datos se adquirieron utilizando una cámara RGB en un entorno doméstico. El entorno es intencionadamente realista e incluye características no controladas, como oclusiones, cambios de iluminación (natural, artificial y nocturna), ropa diferente de los participantes, movimiento en el fondo, diferentes texturas en el suelo y en la habitación, una variedad en los ángulos de caída y diferentes distancias de la cámara a la caída. CAUCAFall es la única base de datos que contiene etiquetas para cada imagen. Los fotogramas que incluían caídas humanas registradas se etiquetaron como "caída", y las actividades AVD se marcaron como "no caída". Este conjunto de datos es útil para desarrollar y evaluar algoritmos modernos de reconocimiento de caídas, como los que aplican extracción de características, redes neuronales convolucionales con detectores YOLOv3-v4, y la ubicación y resolución de la cámara aumentan el rendimiento de algoritmos como OPENPOSE. En el presente trabajo se comparan diferentes algoritmos de visión computacional enfocados al reconocimiento de caídas humanas, específicamente algoritmos que trabajan con extracción de características y redes neuronales convolucionales, evaluando su rendimiento en diferentes bases de datos públicas, incluyendo CAUCAFall. Llegando a la conclusión que en la propuesta que implementa extracción de características, el desempeño es alto en aquellas bases de datos con entornos sumamente controlados; sin cambios de iluminación, sin diferentes ángulos de caída, sin oclusiones, sin cambios de escenario, sin movimiento en el fondo, sin variedad en la distancia de las caídas ante la cámara e incluso sin cambios en las texturas tanto de los entornos como en la ropa de los participantes, además se concluye que estos métodos presentan gran sensibilidad al ruido, oclusiones y cambios en el punto de vista. Por otra parte, las propuestas que basan su trabajo en Redes Neuronales Convolucionales como base de sus investigaciones, tienen un rendimiento mayor en entornos no controlados, en comparación con la extracción de características. Sin embargo, su costo computacional es mucho mayor, siendo casi imposible utilizarlo en detección de caídas en tiempo real. spa
dc.description.abstract In recent years, the recognition of human activities has become an area of constant exploration in different fields. This work includes a literature review focused on the different types of human activities and information acquisition devices for the recognition of activities. It also delves into elderly fall detection via computer vision using feature extraction methods and artificial intelligence techniques, as convolutional neural networks, this study shows the importance of the recognition of human falls in elderly people, as well as allowing to find those factors that hinder the real progress in the area, such as the available databases, which contain excessively controlled elements. Therefore, as part of this research, the authors created CAUCAFall, a database with 10 participants, which simulates five types of falls and five types of activities of daily living (ADLs). Specifically, the data include forward falls, backward falls, lateral falls left, lateral falls right, and falls arising from sitting. The participants performed the following ADLs: walking, hopping, picking up an object, sitting, and kneeling. The dataset considers individuals of different ages, weights, heights, and dominant legs. The data were acquired using an RGB camera in a home environment. This environment was intentionally realistic and included uncontrolled features, such as occlusions, lighting changes (natural, artificial, and night), participants different clothing, movement in the background, different textures on the floor and in the room, and a variety in fall angles and different distances from the camera to the fall. CAUCAFall is the only database that contains labels for each image. Frames including human falls recorded were labeled as "fall", and ADL activities were marked "nofall”. This dataset is useful for developing and evaluating modern fall recognition algorithms, such as those that apply feature extraction, convolutional neural networks with YOLOv3-v4 detectors, and camera location and resolution increase the performance of algorithms such as OPENPOSE. In this paper the authors compare different computer vision algorithms focused on human fall recognition, specifically algorithms working with feature extraction and convolutional neural networks, evaluating their performance on different public databases, including CAUCAFall. The conclusion is that in the proposal that implements feature extraction, the performance is high in those databases with highly controlled environments; without lighting changes, without different fall angles, without occlusions, without changes of scenery, without movement in the background, without variety in the distance of the falls in front of the camera and even without changes in the textures of both the environments and the clothing of the participants, concluding that these methods present great sensitivity to noise, occlusions and changes in the point of view. On the other hand, the proposals that base their work on Convolutional Neural Networks as the basis of their research, have a higher performance in uncontrolled environments, compared to feature extraction. However, its computational cost is much higher, being almost impossible to use it in real-time fall detection. eng
dc.language.iso spa
dc.publisher Universidad del Cauca spa
dc.rights.uri https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject Reconocimiento de caídas spa
dc.subject Visión computacional spa
dc.subject Redes neuronales spa
dc.subject Desempeño spa
dc.title Estudio comparativo de algoritmos de visión computacional orientados al reconocimiento de caídas spa
dc.type Tesis maestría spa
dc.rights.creativecommons https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.type.driver info:eu-repo/semantics/masterThesis
dc.type.coar http://purl.org/coar/resource_type/c_bdcc
dc.publisher.faculty Facultad de Ingeniería Electrónica y Telecomunicaciones spa
dc.publisher.program Maestría en Automática spa
dc.rights.accessrights info:eu-repo/semantics/openAccess
dc.type.version info:eu-repo/semantics/acceptedVersion
dc.identifier.instname
dc.identifier.reponame
oaire.accessrights http://purl.org/coar/access_right/c_abf2
dc.identifier.repourl
oaire.version http://purl.org/coar/version/c_ab4af688f83e57aa


Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

https://creativecommons.org/licenses/by-nc-nd/4.0/ Excepto si se señala otra cosa, la licencia del ítem se describe como https://creativecommons.org/licenses/by-nc-nd/4.0/

Buscar en DSpace


Listar

Mi cuenta