Escudo de la República de Colombia
Sistema Nacional de Biliotecas - Repositorio Institucional Universidad Nacional de Colombia Biblioteca Digital - Repositorio Institucional UN Sistema Nacional de Bibliotecas UN

Predicción funcional de proteínas hipotéticas de mycobacterium tuberculosis a partir del análisis de datos genómicos y post-genómicos / Functional prediction of hypothetical proteins in mycobacterium tuberculosis from genomic and post-genomic data

Hernández Neuta, Ginna Esmeralda (2011) Predicción funcional de proteínas hipotéticas de mycobacterium tuberculosis a partir del análisis de datos genómicos y post-genómicos / Functional prediction of hypothetical proteins in mycobacterium tuberculosis from genomic and post-genomic data. Maestría thesis, Universidad Nacional de Colombia.

Texto completo

[img]
Vista previa
PDF - Versión Aceptada
Available under License Creative Commons Attribution Non-commercial No Derivatives.

3MB

Resumen

El tratamiento efectivo de la infección por Mycobacterium tuberculosis (Mtb) se dificulta por la aparición de cepas resistentes a fármacos, por lo cual se hace prioritaria la identificación de nuevos blancos terapéuticos. Muchos de los genes considerados como esenciales y/o candidatos, se encuentran dentro del 30% del genoma de Mtb cuya función se desconoce, lo que dificulta su validación experimental. Los métodos de biología computacional permiten integrar diferentes tipos de datos para identificar relaciones funcionales entre proteínas conocidas y desconocidas. En este trabajo se utilizó el análisis de correlación canónica basado en kernels (ACCK) para integrar información genómica y post-genómica y predecir posibles funciones de proteínas hipotéticas identificadas previamente como exclusivas del complejo M. tuberculosis (CMTB). Los datos genómicos y post-genómicos obtenidos de las bases de datos públicas, incluyeron información sobre vías metabólicas (KI), distancias intergénicas (kdist), perfiles filogenéticos (kphy), microarreglos (kexp) y grupos de proteínas ortólogas (kcog Para hacer las predicciones funcionales se realizó un ACC entre K). I and KII, donde KI corresponde a la parte conocida del grafo metabólico de Mtb y KII corresponde a la integración de los datos genómicos y pos-genómicos recolectados: KII = kdist + kphy + kexp + kcog. El resultado del ACCK es la proyección de las proteínas en un espacio conjunto, en el cual se pueden calcular distancias entre proteínas conocidas y desconocidas. El umbral de predicción se definió como la mayor distancia entre dos proteínas conocidas que participan en una misma vía metabólica. El ACCK dio como resultado una matriz de distancias para 728 proteínas de Mtb que permitió El análisis desarrollado en este trabajó permitió hacer una aproximación a la anotación de proteínas de Mtb de función desconocida a partir de la integración de datos de distinta naturaleza, aportando al conocimiento de la biología de la micobacteria. El ACCK es un método flexible que permitió integrar variables heterogéneas y proponer posibles funciones para las proteínas estudiadas con un error de clasificación aceptable. El siguiente paso es la validación experimental de las funciones predichas. / Abstract. The need for new drugs against Mycobacterium tuberculosis has led to the identification of novel gene targets, many of which are annotated as proteins of unknown function that makes their experimental validation difficult. Computational biology approaches can integrate data of diverse origin and help to predict protein functions. Here we used the kernel canonical correlation analysis (KCCA) to integrate genomic and post-genomic data to predict the function of hypothetical proteins that were previously identified as exclusive of pathogenic strains of the M. tuberculosis complex (MTBC). Data collected from databases included: metabolic pathways (KI), intergenic distances (kdist), phylogenetic profiles (kphy), microarray data (kexp) and cluster of orthologous groups (kcog). The highest distance between two proteins in the same metabolic pathway was used as threshold to define the possible partners of hypothetical proteins. Using KCCA we analyzed 728 M. tuberculosis proteins with correct classification percentage of 78.3%. Hypothetical proteins were functionally associated with proteins involved in metabolism of amino acids, thiamine, purine and pyrimidine, in phenylalanine biosynthesis and oxidative phosphorylation. The functional relationships predicted for all problem proteins were represented as a global network composed of 314 nodes, of which 140 were associated with at least one metabolic pathway. KCCA is a flexible and useful method for integrating heterogeneous data and inferring possible relationships between known and hypothetical proteins of M. tuberculosis with minimal error of classification. These predicted functions must however be further confirmed by experimental validation.

Tipo de documento:Tesis/trabajos de grado - Thesis (Maestría)
Colaborador / Asesor:Zambrano Eder, María Mercedes
Información adicional:Maestría en Infecciones y Salud en el Trópico.
Palabras clave:Predicción funcional; Proteínas hipotéticas; Mycobacterium tuberculosis; Métodos kernel; Datos genómicos; Biología computacional / Functional prediction; Hypothetical proteins; Mycobacterium tuberculosis; Kernel methods; Genomic data; Computational biology
Temática:6 Tecnología (ciencias aplicadas) / Technology > 61 Ciencias médicas; Medicina / Medicine & health
Unidad administrativa:Sede Bogotá > Facultad de Medicina > Departamento de Salud Pública
Código ID:3886
Enviado por : Universidad Nacional de Colombia Biblioteca Digital - Sede Bogotá
Enviado el día :15 Septiembre 2011 15:19
Ultima modificación:15 Septiembre 2011 15:19
Ultima modificación:15 Septiembre 2011 15:19
Exportar:Clic aquí
Estadísticas:Clic aquí
Compartir:

Solamente administradores del repositorio: página de control del ítem

Vicerrectoría de Investigación: Número uno en investigación
Indexado por:
Indexado por Scholar Google WorldCat DRIVER Metabiblioteca OAIster BASE BDCOL Registry of Open Access Repositories SNAAC Red de repositorios latinoamericanos eprints Open archives La referencia Tesis latinoamericanas OpenDOAR CLACSO
Este sitio web se ve mejor en Firefox