Antecedentes: El Comportamiento Sedentario (CS) se define frecuentemente como
cualquier actividad caracterizada por bajos niveles de gasto energético (≤1.5
equivalentes metabólicos) mientras un individuo está sentado o reclinado. La evidencia
epidemiológica muestra que los CS están asociados con el desarrollo de
enfermedades no transmisibles (ENT), como las enfermedades cardiovasculares
(ECV), la diabetes tipo 2 y el cáncer. Así que, el reconocimiento de este tipo de
comportamientos se hace de vital importancia para que los profesionales de la salud
puedan encontrar nuevas maneras de disminuir el sedentarismo, mediante estrategias
mejor adaptadas al perfil de cada paciente. Objetivo: Este trabajo pretende dar el primer paso para alcanzar un sistema de
reconocimiento de comportamientos sedentarios. Esto mediante la construcción de un
dataset que incluya datos de variables fisiológicas y contextuales que puedan ayudar
al reconocimiento de ese tipo de comportamientos, así como el lugar donde se
producen dentro de un entorno cerrado. Metodología: El proceso de construcción del dataset involucró adaptar la metodología
CRISP-DM, atender a las recomendaciones de algunas investigaciones relacionadas
a la construcción de datasets, diseñar el escenario y sistema adecuados para la
recolección de los datos y realizar la recolección de datos sobre una población
definida. Después de realizada la recolección se describen los datos recolectados, así
como los ajustes realizados sobre algunos de ellos. Finalmente se realiza una
evaluación del dataset en tres etapas para verificar la calidad en la metodología de
construcción del dataset, su estructura y las muestras incluidas en el mismo.
Particularmente, una de las etapas consistió en realizar un experimento de
clasificación para verificar la capacidad del dataset para brindar una buena precisión
en futuros procesos de clasificación.
Conclusiones: La adaptación de CRISP-DM demostró un buen rendimiento para guiar
el proceso de construcción del dataset, sobre todo la instanciación generada a partir
de las recomendaciones dadas en investigaciones relacionadas a la construcción de
datasets para reconocimiento de actividades de la vida diaria. Además, la evaluación
realizada desde las tres perspectivas, logró demostrar la calidad del dataset en cuanto
a la metodología de construcción, la estructura en que se encuentran organizados los
datos, la documentación generada y pudo dar una idea sobre la precisión que puede
alcanzarse en procesos de clasificación usando sus datos.
Background: Sedentarism is associated with the development of noncommunicable
diseases (NCD) such as cardiovascular diseases (CVD), type 2 diabetes, and cancer.
Therefore, the identification of specific sedentary behaviors (TV viewing, sitting at work,
driving, relaxing, etc.) is especially relevant for planning personalized prevention
programs.
Objective: This work aims to take the first step to achieve a system of sedentary
behaviors recognition. This through the construction of a public dataset that includes
physiological and contextual variables that can help to recognize this type of behaviors,
as well as the place where they occur indoors.
Methodology: The dataset’s build process involved adapting the CRISP-DM
methodology, attending to the recommendations of some research related to good
practices in datasets construction, designing the appropriate scenario and system for
collecting the data and performing data collection from a defined population. After the
data collection, the data are described, as well as the adjustments made to some of
them. Finally, an evaluation of the dataset is carried out in three phases to verify the
quality in the methodology of construction of the resulting dataset, its structure and the
samples included. In particular, one of the phases consisted of performing a
classification experiment to verify the dataset's ability to provide good precision in future
classification processes.
Conclusions: The adaptation of CRISP-DM demonstrated a good performance to
guide the dataset’s build process, especially the instantiation generated from the
recommendations given in research related to good practices in the datasets
construction for activities of daily living recognition. In addition, the evaluation carried
out from the three perspectives was able to demonstrate the quality of the dataset in
terms of the construction methodology, the structure in which the data are organized,
the documentation generated and also, an evaluation phase gave an idea of the
classification accuracy that can be achieved in future recognition process with data into
result dataset.