Resumen:
Este trabajo de grado tiene como propósito proponer un algoritmo para el clustering de documentos Web basado en una Matriz de Términos Frecuentes por Oraciones de Documentos, FP-Growth y una variación de Bisecting k-means, y evaluar sus resultados con medidas clásicas de recuperación de la información.