Antecedentes: la roya del café es una enfermedad que causa grandes pérdidas económicas alrededor del mundo. La severidad de esta enfermedad cambia en el tiempo, lo que ocasiona que los agricultores pierdan el control sobre la importancia económica que tiene la enfermedad en sus cultivos. Varios esfuerzos de investigación de aprendizaje supervisado, se han enfocado en crear modelos que permitan detectar la incidencia de roya en los cultivos. Con el objetivo de incrementar la precisión de los resultados, los esfuerzos de investigación en los últimos años se han centrado en la creación de modelos de mayor complejidad y en el aumento de muestras de roya en los conjuntos de datos.
Objetivos: establecer un método de conjunto para la detección de roya en el café basado en datos sintéticos.
Métodos: se propone en primer lugar, incrementar el número de muestras de roya en los conjuntos de datos de estudio, con el objetivo de ampliar el número de escenarios posibles del comportamiento de la enfermedad. Por otra parte, se propone un método de conjunto que permita realizar detecciones del porcentaje de incidencia de roya en cultivos de café colombianos, teniendo en cuenta los datos sintéticos construidos y el conocimiento experto sobre la enfermedad.
Resultados: el presente trabajo entrega como resultados tres conjuntos de datos con datos sintéticos de la incidencia de roya en Colombia, los cuales permiten ampliar el número de muestras de roya para la construcción de modelos de aprendizaje supervisado que permitan detectar el comportamiento de la enfermedad en distintas zonas de Colombia, Por otro lado, se entrega un método de conjunto capaz de realizar detecciones del porcentaje de incidencia de roya para las diferentes regiones cafeteras de Colombia.
Conclusiones: la creación de un mecanismo para la construcción de datos sintéticos que comprenda en sus procesos el comportamiento de algoritmos de interpolación combinado con conocimiento experto permite construir muestras mejor contextualizados, lo que ocasiona una mejor representación del comportamiento de la roya en los conjuntos de datos colombianos.
Background: the coffee rust is a devastating disease that causes large economic losses across the world. The severity of this disease changes over time, so the farmers are not fully aware of the economic importance of the rust disease in the coffee crops. Several research works have created machine learning models to detect coffee rust. Several research works have created machine learning models to detect coffee rust. Nowadays, to increase the precision in the results, the research works have built more complex models, and they try increasing the number of coffee rust samples.
Objectives: establish an ensemble learning method for detection of coffee rust based on synthetic data.
Methods: first, it is proposed to increase the number of coffee rust samples in the datasets studied, to extend the number of scenes about coffee rust behavior. On the other hand, an ensemble learning method is proposed for the detection of the incidence coffee rust percentage in Colombian coffee crops, taking account of the synthetic data built and expert knowledge.
Results: this research work has the following results: three datasets with synthetic data about coffee rust incidence in Colombia that increase the number of coffee rust samples for construction of supervised learning models to detect coffee rust in the different Colombian regions. On the other hand, an ensemble method is delivered, which can detect the coffee rust incidence percentage to several Colombian regions.
Conclusions: the creation of a mechanism to create synthetic data that includes the behavior of interpolation algorithms and expert knowledge in their processes allows generating better samples and a better representation of the behavior of the coffee rust disease in Colombian datasets.