Nowadays, the increase in network traffic, applications, and users imposes challenges in the scalability and adaptability of network functions and services. Traditional scaling so-lutions oversize statically the capacity of network appliances, designing them to support workload peaks. However, static scaling is inefficient at periods of low utilization. The Net-work Functions Virtualization (NFV) offers an alternative solution to static scaling, enabling dynamically to modify the capacity of network functions. NFV-based scaling has been pro-posed in several works. However, still there are open research questions on the NFV scaling decision-making process to be investigated, such as the precision on which, how, and when to scale network functions. This thesis hypothesizes that reinforcement learning can offer a valuable approach to develop scaling in NFV, and pursues the main objective of introducing scaling mechanisms for adaptive management of traffic and performance variations in NFV.
En la actualidad, el aumento del tráfico, las aplicaciones y los usuarios imponen desafíos en la escalabilidad y adaptabilidad de las funciones y servicios de la red. Las soluciones de escalado tradicionales sobredimensionan estáticamente la capacidad de los dispositivos de red y los diseñan para soportar picos de carga de trabajo. Sin embargo, el escalado estático es ineficaz en periodos de baja utilización. La Virtualización de Funciones de Red (NFV) ofrece una solución alternativa al escalado estático, permitiendo modificar dinámicamente la capacidad de las funciones de red. El escalado basado en NFV se ha propuesto en varios trabajos. Sin embargo, todavía hay preguntas de investigación abiertas sobre el proceso de toma de decisiones de escalado de NFV que deben investigarse, como la precisión sobre cuáles, cómo y cuándo escalar las funciones de red. Esta tesis plantea la hipótesis de que el aprendizaje por refuerzo puede ofrecer un enfoque valioso para desarrollar el escalado en NFV, y persigue el objetivo principal de introducir mecanismos de escalado para la gestión adaptativa del tráfico y las variaciones de rendimiento en NFV.