Repositorio Universidad del Cauca

Modelo multidimensional de aprendizaje automático para determinar un índice de vulnerabilidad de la COVID-19

Mostrar el registro sencillo del ítem

dc.contributor.author Realpe González, Juan Sebastián
dc.contributor.author Rosero Pérez, Paula Andrea
dc.date.accessioned 2023-06-05T20:47:14Z
dc.date.available 2023-06-05T20:47:14Z
dc.date.issued 2023
dc.identifier.uri http://repositorio.unicauca.edu.co:8080/xmlui/handle/123456789/7364
dc.description.abstract La COVID-19 es una enfermedad infecciosa causada por un virus denominado SARS-CoV- 2, la cual fue reportada por primera vez el 31 de diciembre de 2019, al advertirse de un grupo de casos de neumonía vírica en Wuhan, República Popular de China. La epidemia de la COVID-19 fue catalogada por la Organización Mundial de la Salud (OMS) como una Emergencia de Salud Pública de Importancia Internacional (ESPII) el 30 de enero de 2020. En Colombia, el primer caso fue confirmado el 6 de marzo del 2020. Posteriormente, el 11 de marzo de 2020 la OMS declaró que la COVID-19 podía caracterizarse como una pandemia. En consecuencia, el DANE publicó un índice de vulnerabilidad ante la COVID-19 denominado “Índice de vulnerabilidad por manzana con el uso de variables demográficas y comorbilidades”, el cual permite conocer la vulnerabilidad por manzana que tienen las personas en caso de ser contagiadas de COVID-19. Los datos empleados fueron los obtenidos en el Censo Nacional de Población y Vivienda 2018 (CNPV) y el Registro Individual de Prestaciones de Salud (RIPS). Para identificar las manzanas con altos niveles de vulnerabilidad fue realizado un análisis de clúster K-means, y los niveles de vulnerabilidad se clasificaron como: baja, media-baja, media, media-alta, y alta. Desafortunadamente, para el cálculo del índice propuesto, el DANE no consideró múltiples factores de riesgo (que podrían aumentan el riesgo de la COVID-19) encontrados en la literatura (como, por ejemplo: factores ambientales tales como temperatura y precipitación). El objetivo de este trabajo es identificar los factores de riesgo más relevantes en el contagio por la COVID-19, y proponer un índice de vulnerabilidad que considere dichos factores. Este trabajo propone dos índices de vulnerabilidad, el primero es un índice que considera la información del CNPV 2018 (la cual no incluye información de comorbilidades por privacidad de los pacientes). El segundo índice se desarrolló considerando que los resultados del primer índice tuvieron resultados bajos en las métricas seleccionadas. El segundo índice es de tipo multidimensional, ya que considera los valores del índice ya calculado por el DANE y datos de otras variables encontradas como factores de riesgo (como por ejemplo: tasa de desempleo, PIB, variables de movilidad, entre otros). Para la realización de ambos índices se consideraron las siguientes fases: recolección de los datos, preparación de los datos y, modelado y evaluación considerando algoritmos de clasificación (para el primer índice) y de regresión (para el segundo índice). Los resultados de las fases realizadas permitieron observar que al considerar diferentes tipos de factores de riesgo se presenta una mayor correlación entre las variables y la incidencia al COVID-19. Con el cálculo del segundo índice de vulnerabilidad, se logró revisar cuál sería el mejor modelo de Machine Learning (ML) para predecir la incidencia en las ciudades capitales de Colombia. Los resultados demostraron que el modelo ExtraTreesRegressor obtuvo los mejores valores en las métricas utilizadas, por lo que, se considera un modelo adecuado para lograr el objetivo. spa
dc.description.abstract COVID-19 is an infectious disease caused by a virus named SARS-CoV-2, which was first reported on December 31, 2019, upon warning of a cluster of viral pneumonia cases in Wuhan, People's Republic of China. The COVID-19 epidemic was listed by the World Health Organization (WHO) as a Public Health Emergency of International Importance (PHEIC) on January 30, 2020. In Colombia, the first case was confirmed on March 6, 2020. Subsequently, on March 11, 2020, WHO declared that COVID-19 could be characterized as a pandemic. Consequently, DANE published an index of vulnerability to COVID-19 called "Index of vulnerability by block using demographic variables and comorbidities”, which allows us to know the vulnerability per city block that people have in case of being infected with COVID-19. The data used were those obtained from the 2018 "Censo Nacional de Población y Vivienda" (CNPV) and the "Registro Individual de Prestación de Servicios de Salud" (RIPS). To identify the blocks with high levels of vulnerability, a K-means cluster analysis was proposed, and the vulnerability levels were classified as: low, medium-low, medium, medium-high, and high. Unfortunately, for the calculation of the proposed index, DANE did not consider multiple risk factors (that could increase the risk of COVID-19) found in the literature (such as: environmental factors such as temperature and precipitation). This work aims to identify the most relevant risk factors that influence COVID-19 infection and to propose a vulnerability index that considers these factors. This work proposes two vulnerability indexes. The first is an index that considers information from the CNPV 2018 (which does not include information on comorbidities due to patient privacy). The second index was developed considering that the results of the first index had low results in the selected metrics. The second index is multidimensional, since it considers the values of the index already calculated by DANE and data from other variables found as risk factors (such as: unemployment rate, gross domestic product, and mobility variables, among others). The following phases were considered for the realization of both indexes: data collection, data preparation and, modeling and evaluation considering classification algorithms (for the first index) and regression algorithms (for the second index). The results of these phases showed that when considering different types of risk factors, there is a greater correlation between the variables and the incidence of COVID-19. With the second vulnerability index calculation, it was possible to review which would be the best Machine Learning (ML) model to predict the incidence in capital cities of Colombia. The results showed that the ExtraTreesRegressor model obtained the best values in the metrics used; therefore, it is considered an adequate model to achieve the objective. eng
dc.language.iso spa
dc.publisher Universidad del Cauca spa
dc.subject Aprendizaje automático spa
dc.subject Vulnerabilidad spa
dc.subject COVID-19 eng
dc.subject Riesgo spa
dc.subject Factores de riesgo spa
dc.subject Modelo spa
dc.title Modelo multidimensional de aprendizaje automático para determinar un índice de vulnerabilidad de la COVID-19 spa
dc.type Trabajos de grado spa


Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Buscar en DSpace


Búsqueda avanzada

Listar

Mi cuenta