Resumen:
Uno de los problemas más complejos en la gestión de pavimentos consiste en saber
cómo mantener y reparar las carreteras con el menor costo posible y afectando en
menor medida el servicio que ellas prestan. Una estrategia muy utilizada para definir
cuando una carretera requiere mantenimiento o reparación es la que se basa en el
índice de servicio del pavimento (Pavement Serviceability Index, PSI), dicho valor
entre más cercano a 5 expresa que la carretera está en óptimas condiciones,
mientras que al bajar a 0 quiere decir que la carretera está casi inservible. Predecir
el valor del PSI es muy importante en este escenario, ya que esto permite planear
a futuro que intervenciones se deben realizar en las carreteras, buscando que sean
menos costosas que una rehabilitación completa. Para predecir este valor, en el
estado del arte se encuentran diferentes técnicas, entre ellas las basadas en
machine learning y más específicamente el modelo de clusterwise linear regresión
(CLR) que reporta los mejores resultados. Los trabajos previos muestran que
construir este modelo es costoso en tiempo y ese costo crece exponencialmente en
la medida que el número de registros de entrenamiento aumenta. En esta
investigación se presenta un algoritmo Greedy que crea un modelo CLR con base
en un conjunto de muestras de pavimentos tomados del departamento de transporte
de Nevada en Estados Unidos. Este algoritmo es más eficiente que los presentados
en el estado del arte (menor tiempo de construcción y mayor calidad en la
predicción). El algoritmo permite definir grupos de tramos de carreteras con sus
respectivos modelos de regresión lineal y los pesos de los atributos del dataset de
entrenamiento para que en conjunto con el algoritmo 1-NN se facilite la asignación
de un nuevo tramo de carretera al grupo adecuado y de esta forma predecir el valor
de PSI con el modelo de regresión de dicho grupo.