Resumen:
En este documento se presenta el trabajo titulado Modelos de Lenguaje Basados en Gramáticas Incontextuales Probabilísticas desarrollado en el seminario de grado orientado por el Doctor Freddy Amaya. Está enmarcado en la línea de Matemática Computacional perteneciente al Grupo de Estudio y Desarrollo Investigativo en Matemática Aplicada, exigido como requisito parcial para la obtención del título de Licenciado en Matemáticas otorgado por la Universidad del Cauca. En él se tratan dos modelos de lenguaje híbridos obtenidos a partir de la combinación de un modelo de n-gramas y una gramática incontextual, además dos algoritmos que permiten separar en clases las palabras de un vocabulario dado e incorporar tal clasificación a la estimación de probabilidades de un modelo de lenguaje basado en gramáticas. Para ello se revisarán brevemente los conceptos de: Gramáticas, Gramáticas Incontextuales (GIC), Gramáticas Incontextuales Probabilisticas (GIP), Modelos de Lenguaje Probabilísticos. Se presenta el algoritmo de estimación estándar (Inside-Outside IO o Viterbi), a través del cual se pueden estimar las probabilidades de las reglas de una gramática; se presentan dos algoritmos para agrupar en clases el vocabulario, Algoritmo de Della Pietra y Algoritmo de Ney, y los resultados experimentales del uso de la clasificación en el modelo de lenguaje.