Implementación de un sistema de procesamiento de la voz humana con deep learning que permita el reconocimiento de vocablos

Camargo Caicedo, Andrés Felipe; Moreno Camargo, Luis Gustavo

Principal
→
Facultad de Ingeniería Electrónica y Telecomunicaciones
→
Ingeniería Electrónica y Telecomunicaciones
→
Ver ítem

dc.contributor.author	Camargo Caicedo, Andrés Felipe
dc.contributor.author	Moreno Camargo, Luis Gustavo
dc.date.accessioned	2022-12-05T22:00:22Z
dc.date.available	2022-12-05T22:00:22Z
dc.date.issued	2022
dc.identifier.uri	http://repositorio.unicauca.edu.co:8080/xmlui/handle/123456789/5898
dc.description.abstract	El presente trabajo de grado de investigación tiene como objetivo principal el implementar un sistema de transcripción de comandos de voz, basado en algoritmos de Aprendizaje Profundo (DL, Deep Learning), capaz de reconocer vocablos específicos, para evaluar el desempeño del sistema implementado en el Reconocimiento Automático del Habla (ASR, Automatic Speech Recognition). Para su funcionamiento, se crea una base de datos conteniendo ficheros tipo WAVE de 7 vocablos diferentes, se realiza el pre-procesado de las señales de audio y se extraen los atributos de interés, en este caso, los Coeficientes Cepstrales en las Frecuencias de MEL (MFCC, Mel Frequency Cepstral Coefficients), los cuales servirán como entrada del algoritmo de DL. Para su desarrollo se utiliza la herramienta de programación Python, la cual ofrece librerías de mucha utilidad tanto en el manejo de archivos de audio, como en el desarrollo de aplicaciones en el campo del Aprendizaje Automático (ML, Machine Learning). Así mismo, Python permite con sus librerías el análisis de los resultados obtenidos a partir de las métricas seleccionadas para la evaluación del desempeño de este algoritmo en el reconocimiento de vocablos. Finalmente se concluye sobre los resultados obtenidos y se enumeran posibles adaptaciones y trabajos futuros.	en_US
dc.language.iso	es	en_US
dc.publisher	Universidad del Cauca	en_US
dc.subject	Deep learning	en_US
dc.subject	Voz humana	en_US
dc.subject	Inteligencia artificial	en_US
dc.subject	Machine learning	en_US
dc.subject	Reconocimiento	en_US
dc.subject	Redes neuronales	en_US
dc.title	Implementación de un sistema de procesamiento de la voz humana con deep learning que permita el reconocimiento de vocablos	en_US
dc.type	Trabajos de grado	en_US