Proteogenómica computacional para la detección y caracterizacion de proteínas en el contexto del proyecto proteoma humano

  1. González Gomariz, José
Dirigida por:
  1. Elizabeth Guruceaga Director/a
  2. Victoriano Segura Ruiz Director/a

Universidad de defensa: Universidad de Navarra

Fecha de defensa: 25 de junio de 2021

Tribunal:
  1. Francisco Javier Novo Villaverde Presidente/a
  2. Mikel Hernáez Secretario/a
  3. José Alberto Egea Larrosa Vocal
  4. Enrique Santamaría Martínez Vocal
  5. Fernando Jose Corrales Izquierdo Vocal

Tipo: Tesis

Teseo: 154911 DIALNET lock_openDadun editor

Resumen

En los últimos años, la consolidación de la tecnología de secuenciación masiva (NGS) en el área de la Genómica está ampliando la información que es posible obtener a partir de este tipo de experimentos (Trapnell, 2012). La posibilidad de obtener la secuencia completa de ADN de un genoma, o de ARN de un transcriptoma mediante un único experimento ha supuesto grandes avances en los estudios de genotipado y en la identificación de nuevas alteraciones cromosómicas y mutaciones puntuales. Tras los avances y resultados obtenidos en Genómica, el estudio de las proteínas codificadas por el genoma (proteoma) es el siguiente paso para comprender la fisiología humana, tanto en individuos sanos como enfermos. El estudio del proteoma, a pesar de presentar similitudes con el estudio del genoma, supone un gran desafío que la comunidad científica debe acometer. Los avances en espectrometría de masas, actualmente la tecnología más potente disponible en Proteómica (Nilsson, 2010), están generando un volumen de datos enorme que hacen imprescindible la participación de otras áreas como la Estadística, la Minería de datos y la Computación de Altas Prestaciones para poder analizarlos. Sin embargo, el análisis preciso de estos datos es un reto para el cual se requiere el desarrollo de nuevas herramientas. Otro de los desafíos pendientes dentro del campo de la Proteómica es la caracterización de proteínas detectadas experimentalmente de las que se desconoce su función, localización celular ó su implicación en determinadas enfermedades, para los que desde la comunidad científica se han propuesto distintos retos. La presente tesis describe varios flujos de trabajo, implementados para la identificación de proteínas de las que no existe evidencia experimental y para la caracterización funcional de proteínas de las que no se conoce su función, localización e implicación en enfermedades. Además, se hace una incursión en el campo del procesado de señal aplicando la Transformada Wavelet a distintos tipos de señales, tanto de experimentos de secuenciación de nueva generación (NGS) como de experimentos de espectrometría de masas, desarrollados con el objetivo de mejorar el análisis de este tipo de señales.