Repositorio Universidad del Cauca

Modelo de predicción de exones que integra características fractales del ADN en una técnica de aprendizaje de máquina de minería de datos

Mostrar el registro sencillo del ítem

dc.contributor.author Téllez Villa, Carlos Eduardo
dc.contributor.author Caldón Pizo, Edwin Ferney
dc.date.accessioned 2023-01-31T16:40:42Z
dc.date.available 2023-01-31T16:40:42Z
dc.date.issued 2008
dc.identifier.uri http://repositorio.unicauca.edu.co:8080/xmlui/handle/123456789/5975
dc.description.abstract El presente trabajo analiza la búsqueda de patrones en secuencias ADN que evidencien la presencia de regiones codificantes, con el fin de construir un modelo de predicción de exones, aprovechando las características estadísticas y fractales presentes en el ADN y medir la capacidad de dichas características en la clasificación de secuencias codificantes. Es de vital importancia la identificación de componentes en las secuencias de ADN tales como, regiones codificantes y no codificantes, regiones promotoras, regiones dadoras, entre otras señales, con un alto nivel de confianza, ya que dichos componentes son la base de la expresión genética, la cual permite por técnicas de comparación de genomas eucariotes completar la información de las secuencias en las Base de Datos genómicas que aun no están secuenciadas experimentalmente o inferir información de organismos no conocidos con base en las predicciones realizadas. Pero el problema de predicción de secuencias codificantes aún no se resuelve a un nivel satisfactorio y cabe aplicar otra clase de enfoques, que ayuden a construir nuevos caminos de exploración en este tema. Mediante Minería de Datos se aplica medidas estándar usadas en la predicción de genes y medidas fractales utilizadas en teoría de la información y sistemas complejos, para analizar patrones presentes en las secuencias de ADN con el fin discriminar secuencias codificantes de no codificantes. Con los patrones encontrados se crea un modelo aplicando técnicas de Aprendizaje de Máquina usadas en Minería de Datos para medir la efectividad de clasificación de los patrones encontrados entre exones e intrones. Los patrones encontrados por las medidas estadísticas tienen una efectividad promedio del 70% de clasificación, las medidas fractales usadas en sistemas complejos tienen una efectividad del 80% y las medidas aplicadas en la teoría de la información ofrecen información importante acerca de los genomas estudiados pero no es lo suficientemente especifica para obtener información de una secuencia de forma independiente. Empleando sólo las medidas estadísticas como atributos del modelo de clasificación de exones se obtuvo en promedio 79.8% de efectividad con árboles de decisión (AD), 78% con Redes Bayesianas (BN) y 77.8% con Redes Neuronales (PM); usando sólo atributos fractales se obtuvo 88% con AD, 86.3% con BN y 85% con PM; y la combinación de los dos tipos de atributos se obtuvo un 91.8% con AD, 89% con BN y 89.4% de efectividad con PM. Los resultados de esta investigación sugieren que las medidas fractales ofrecen un alto porcentaje de efectividad de clasificación frente a las medidas estadísticas y en combinación se obtiene un alto nivel de clasificación. Este trabajo muestra que se deben seguir invirtiendo esfuerzos en la aplicación de medidas fractales para la búsqueda de patrones o señales en las secuencias de ADN. Extrapolar estas medidas en la búsqueda de otras señales en genes como regiones promotoras, regiones terminadoras, entre otras y desarrollar herramientas bioinformáticas para investigadores científicos. en_US
dc.language.iso es en_US
dc.publisher Universidad del Cauca en_US
dc.subject Bioinformática en_US
dc.subject Fractales en_US
dc.subject Predicción exones en_US
dc.subject Aprendizaje de máquina en_US
dc.subject Text Mining en_US
dc.title Modelo de predicción de exones que integra características fractales del ADN en una técnica de aprendizaje de máquina de minería de datos en_US
dc.type Trabajos de grado en_US


Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Buscar en DSpace


Listar

Mi cuenta