Resumen:
La Inteligencia Artificial (IA) se ha convertido en una herramienta esencial para la resolución de cuestiones científicas, reduciendo de manera consecuente y significativa las demandas diarias en la mayoría de los sectores de la sociedad. Esto se refleja en áreas tan diversas como el consumo de plataformas de streaming, las recomendaciones en buscadores en línea, el mercado bursátil y el reconocimiento de voz. Desde su primera mención en 1956, la simplificación de procesos operacionales ha sido uno de los mayores avances logrados por la IA. Su desarrollo ha sido notable; sin embargo, su aplicación no se limita solo a tareas cotidianas; también ha experimentado un auge significativo en campos como el desarrollo científico e investigativo, contribuyendo enormemente al avance de la ingeniería y la medicina, principalmente. En las ciencias naturales, su uso también ha sido fundamental, logrando hitos importantes como la invención de robots capaces de realizar procesos de laboratorio repetitivos pero imprescindibles.
En el campo de la química, los logros impulsados por la IA no solo se circunscriben a la invención de maquinaria operativa, sino que también abarcan la mejora en la eficiencia de las reacciones químicas. Mediante una de sus ramas más relevantes, el Aprendizaje Automático o Machine Learning (ML), ha sembrado la semilla de la Catálisis Digital. Este proceso implica el uso de herramientas de ML para identificar patrones que ayuden a los modelos matemáticos a predecir una variable seleccionada.
Este trabajo tiene como objetivo demostrar una aplicación práctica del uso de herramientas computacionales de IA y ML en el modelado y la predicción del rendimiento de la reacción de epoxidación catalítica del ciclohexeno, el cual fue de 85,54%. Esto se logró extrayendo decenas de datos experimentales de la bibliografía publicada y organizándolos en un conjunto de datos (dataset), que se utilizó para alimentar distintos modelos de ML y de Aprendizaje Profundo o Deep Learning (DL, un subconjunto de ML). El propósito fue entrenar estos modelos para predecir el porcentaje de rendimiento de la reacción, evaluando posteriormente la precisión de las predicciones mediante la replicación de la reacción en el laboratorio. Los descriptores de entrada varían desde características del catalizador hasta condiciones de reacción, todos con una relativa facilidad de obtención, mientras que la salida es el valor del porcentaje de rendimiento.
Los resultados del entrenamiento sugirieron un modelo con una buena correlación relativa entre las variables independientes y la dependiente (|R^2|=0,7928). Algunos aspectos relacionados con la descripción del catalizador podrían ser claves para refinar el modelo y mejorar la precisión en las predicciones, que con un porcentaje de error del 94,39% entre los datos experimentales y los predichos, demuestra que aún tiene potencial de mejorar.