Repositorio Universidad del Cauca

Implementación de un sistema de procesamiento de la voz humana con deep learning que permita el reconocimiento de vocablos

Mostrar el registro sencillo del ítem

dc.contributor.author Camargo Caicedo, Andrés Felipe
dc.contributor.author Moreno Camargo, Luis Gustavo
dc.date.accessioned 2022-12-05T22:00:22Z
dc.date.available 2022-12-05T22:00:22Z
dc.date.issued 2022
dc.identifier.uri http://repositorio.unicauca.edu.co:8080/xmlui/handle/123456789/5898
dc.description.abstract El presente trabajo de grado de investigación tiene como objetivo principal el implementar un sistema de transcripción de comandos de voz, basado en algoritmos de Aprendizaje Profundo (DL, Deep Learning), capaz de reconocer vocablos específicos, para evaluar el desempeño del sistema implementado en el Reconocimiento Automático del Habla (ASR, Automatic Speech Recognition). Para su funcionamiento, se crea una base de datos conteniendo ficheros tipo WAVE de 7 vocablos diferentes, se realiza el pre-procesado de las señales de audio y se extraen los atributos de interés, en este caso, los Coeficientes Cepstrales en las Frecuencias de MEL (MFCC, Mel Frequency Cepstral Coefficients), los cuales servirán como entrada del algoritmo de DL. Para su desarrollo se utiliza la herramienta de programación Python, la cual ofrece librerías de mucha utilidad tanto en el manejo de archivos de audio, como en el desarrollo de aplicaciones en el campo del Aprendizaje Automático (ML, Machine Learning). Así mismo, Python permite con sus librerías el análisis de los resultados obtenidos a partir de las métricas seleccionadas para la evaluación del desempeño de este algoritmo en el reconocimiento de vocablos. Finalmente se concluye sobre los resultados obtenidos y se enumeran posibles adaptaciones y trabajos futuros. en_US
dc.language.iso es en_US
dc.publisher Universidad del Cauca en_US
dc.subject Deep learning en_US
dc.subject Voz humana en_US
dc.subject Inteligencia artificial en_US
dc.subject Machine learning en_US
dc.subject Reconocimiento en_US
dc.subject Redes neuronales en_US
dc.title Implementación de un sistema de procesamiento de la voz humana con deep learning que permita el reconocimiento de vocablos en_US
dc.type Trabajos de grado en_US


Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Buscar en DSpace


Listar

Mi cuenta