Modelo de predicción de exones que integra características fractales del ADN en una técnica de aprendizaje de máquina de minería de datos

Téllez Villa, Carlos Eduardo; Caldón Pizo, Edwin Ferney

Principal
→
Facultad de Ingeniería Electrónica y Telecomunicaciones
→
Ingeniería de Sistemas
→
Ver ítem

dc.contributor.author	Téllez Villa, Carlos Eduardo
dc.contributor.author	Caldón Pizo, Edwin Ferney
dc.date.accessioned	2023-01-31T16:40:42Z
dc.date.available	2023-01-31T16:40:42Z
dc.date.issued	2008
dc.identifier.uri	http://repositorio.unicauca.edu.co:8080/xmlui/handle/123456789/5975
dc.description.abstract	El presente trabajo analiza la búsqueda de patrones en secuencias ADN que evidencien la presencia de regiones codificantes, con el fin de construir un modelo de predicción de exones, aprovechando las características estadísticas y fractales presentes en el ADN y medir la capacidad de dichas características en la clasificación de secuencias codificantes. Es de vital importancia la identificación de componentes en las secuencias de ADN tales como, regiones codificantes y no codificantes, regiones promotoras, regiones dadoras, entre otras señales, con un alto nivel de confianza, ya que dichos componentes son la base de la expresión genética, la cual permite por técnicas de comparación de genomas eucariotes completar la información de las secuencias en las Base de Datos genómicas que aun no están secuenciadas experimentalmente o inferir información de organismos no conocidos con base en las predicciones realizadas. Pero el problema de predicción de secuencias codificantes aún no se resuelve a un nivel satisfactorio y cabe aplicar otra clase de enfoques, que ayuden a construir nuevos caminos de exploración en este tema. Mediante Minería de Datos se aplica medidas estándar usadas en la predicción de genes y medidas fractales utilizadas en teoría de la información y sistemas complejos, para analizar patrones presentes en las secuencias de ADN con el fin discriminar secuencias codificantes de no codificantes. Con los patrones encontrados se crea un modelo aplicando técnicas de Aprendizaje de Máquina usadas en Minería de Datos para medir la efectividad de clasificación de los patrones encontrados entre exones e intrones. Los patrones encontrados por las medidas estadísticas tienen una efectividad promedio del 70% de clasificación, las medidas fractales usadas en sistemas complejos tienen una efectividad del 80% y las medidas aplicadas en la teoría de la información ofrecen información importante acerca de los genomas estudiados pero no es lo suficientemente especifica para obtener información de una secuencia de forma independiente. Empleando sólo las medidas estadísticas como atributos del modelo de clasificación de exones se obtuvo en promedio 79.8% de efectividad con árboles de decisión (AD), 78% con Redes Bayesianas (BN) y 77.8% con Redes Neuronales (PM); usando sólo atributos fractales se obtuvo 88% con AD, 86.3% con BN y 85% con PM; y la combinación de los dos tipos de atributos se obtuvo un 91.8% con AD, 89% con BN y 89.4% de efectividad con PM. Los resultados de esta investigación sugieren que las medidas fractales ofrecen un alto porcentaje de efectividad de clasificación frente a las medidas estadísticas y en combinación se obtiene un alto nivel de clasificación. Este trabajo muestra que se deben seguir invirtiendo esfuerzos en la aplicación de medidas fractales para la búsqueda de patrones o señales en las secuencias de ADN. Extrapolar estas medidas en la búsqueda de otras señales en genes como regiones promotoras, regiones terminadoras, entre otras y desarrollar herramientas bioinformáticas para investigadores científicos.	en_US
dc.language.iso	es	en_US
dc.publisher	Universidad del Cauca	en_US
dc.subject	Bioinformática	en_US
dc.subject	Fractales	en_US
dc.subject	Predicción exones	en_US
dc.subject	Aprendizaje de máquina	en_US
dc.subject	Text Mining	en_US
dc.title	Modelo de predicción de exones que integra características fractales del ADN en una técnica de aprendizaje de máquina de minería de datos	en_US
dc.type	Trabajos de grado	en_US