Resumen:
El gran volumen, variedad y velocidad del tráfico generado por el advenimiento de
IoT (Internet of Things) y la inclusión exponencial de nuevas aplicaciones y servicios
en la red, requieren soporte en los centros de datos. Las técnicas de enrutamiento
convencionales en los centros de datos como ECMP (Equal Cost Multi-Path) pueden
degradar el rendimiento de la red cuando manejan flujos elefante y ratón. Lo cual
compromete el cumplimiento de los requisitos de latencia, QoS (Quality of Service)
y QoE (Quality of Experience) del centro de datos, y afecta directamente el desempeño
de las aplicaciones y servicios que soporta. Por esta razón, se han propuesto
novedosas técnicas para clasificar los flujos elefante y procesarlos especialmente en
pro de la red. Varios enfoques emplean ML (Machine Learning) en el Plano de Control
SDN (Software Defined Networking) o en los servidores de la red para clasificar
los flujos. Sin embargo, estos métodos producen sobrecarga de tráfico, baja escalabilidad
y alto tiempo de clasificación. Este Trabajo de grado propone un nuevo
método de clasificación de flujos elefante y ratón, llamado P4Tree, el cual aplica RF
(Random Forest) en el Plano de Datos programable de una red SDN para clasificar
los flujos de forma rápida y precisa. P4Tree entrena un modelo RF fuera de línea y lo
despliega en el Plano de Datos para que clasifique flujos a velocidad de línea. P4Tree
es exhaustivamente evaluado a partir de trazas de tráfico real y diferentes configuraciones
de RF. Los resultados de la evaluación muestran que P4Tree es preciso y
logra un tiempo de clasificación bajo.