Antecedentes: El agua, vital para la existencia humana y estrechamente vinculada a la
salud pública, es tratada en plantas especializadas, como "El Tablazo" en Popayán, para
asegurar su calidad. La coagulación, uno de los procesos esenciales en estas plantas,
depende de una precisa dosificación del coagulante para ser efectiva y evitar riesgos
sanitarios. Aunque en "El Tablazo" se utiliza la técnica de pruebas de jarra, esta puede
ser susceptible a errores humanos y no adaptarse a cambios abruptos en la calidad
del agua. La emergencia de modelos de Aprendizaje Automático (ML) promete mayor
precisión en esta tarea, pero las investigaciones recientes a menudo pasan por alto el
impacto de las variables meteorológicas en la coagulación y calidad del agua.
Objetivo: Desarrollar un sistema de recomendación de la dosis de coagulante para el
proceso de potabilización del agua en la planta "El Tablazo" del municipio de Popayán
utilizando técnicas de aprendizaje automático.
Métodos: En este estudio, se propone la adopción de avanzados modelos de ML que
consoliden y analicen de manera integral datos hidrológicos y meteorológicos. La principal
motivación de esta integración es diseñar un robusto sistema de recomendación
que permita determinar de forma precisa la dosis de coagulante necesaria. A través de
esta propuesta, se aspira no solo a garantizar y mejorar significativamente la calidad del
agua potable, sino también a lograr una reducción notable en los costos asociados al
tratamiento y potabilización del agua.
Resultados: A lo largo de la investigación, se logró consolidar un exhaustivo conjunto
de datos, el cual comprende información tanto hidrológica como meteorológica, específicamente
de la planta de tratamiento "El Tablazo". Adicionalmente, se desarrollaron y
refinaron dos modelos predictivos para la determinación de la dosis de coagulante: uno
orientado a la clasificación y otro a la regresión. Estos modelos, fruto de rigurosos análisis,
fueron posteriormente entregados al jefe de producción de la mencionada planta
de tratamiento, con el objetivo de ser implementados y evaluados en un entorno real y
operativo, asegurando su aplicabilidad y eficacia en escenarios prácticos.
Conclusión: A lo largo del meticuloso estudio que fusionó variables hidrológicas y meteorológicas,
se resaltó la importancia cardinal de las condiciones climáticas en determinar
la calidad del agua y la precisión en la dosificación de coagulantes. La implementación
de modelos avanzados, en particular el algoritmo de Bosques Aleatorios (RF),
demostró ser un instrumento prevalente y robusto, capaz de manejar la complejidad de dichas variables y ofrecer predicciones consistentes. Esta investigación no solo subraya
la imperativa integración de datos ambientales en la gestión del agua, sino que también
establece a RF como una herramienta clave, posicionando a la planta de tratamiento "El
Tablazo" en la frontera de las innovaciones en tratamiento de agua.
Background: Water, vital for human existence and closely linked to public health, is
treated in specialized plants, such as "El Tablazo" in Popayán, to ensure its quality. Coagulation,
one of the essential processes in these plants, relies on accurate coagulant
dosing to be effective and avoid health risks. Although "El Tablazo" employs the jar test
technique, it can be susceptible to human errors and may not adapt to abrupt changes
in water quality. The emergence of Machine Learning (ML) models promises greater
accuracy in this task, but recent research often overlooks the impact of meteorological
variables on coagulation and water quality.
Objective: Develop a recommendation system for coagulant dosing in the water purification
process at the "El Tablazo" plant in the municipality of Popayán using machine
learning techniques.
Methods: In this study, the adoption of advanced ML models is proposed to comprehensively
consolidate and analyze hydrological and meteorological data. The main motivation
for this integration is to design a robust recommendation system that accurately
determines the required coagulant dose. Through this proposal, the goal is not only to
ensure and significantly improve the quality of drinking water but also to achieve a notable
reduction in water treatment and purification costs.
Results: Throughout the research, an exhaustive data set was consolidated, encompassing
both hydrological and meteorological information, specifically from the "El Tablazo"
treatment plant. Additionally, two predictive models were developed and refined
for determining the coagulant dose: one focused on classification and the other on regression.
These models, the result of rigorous analysis, were subsequently provided to
the production manager of the aforementioned treatment plant, aiming to be implemented
and evaluated in a real and operational environment, ensuring their applicability and
effectiveness in practical scenarios.
Conclusion: Throughout the meticulous study that merged hydrological and meteorological
variables, the cardinal importance of climatic conditions in determining water quality
and accuracy in coagulant dosing was highlighted. Implementing advanced models, particularly
the Random Forests (RF) algorithm, proved to be a prevalent and robust tool,
capable of handling the complexity of these variables and providing consistent predictions.
This research not only emphasizes the imperative integration of environmental
data in water management but also establishes RF as a key tool, positioning the "El Tablazo" treatment plant at the forefront of innovations in water treatment.