Se ha mapeado completamente el código genético humano, lo que proporciona a los científicos un modelo de ADN para identificar las regiones genómicas y sus variantes responsables de las enfermedades. Las herramientas estadísticas tradicionales identifican eficazmente estas “agujas en el pajar” genéticas, pero enfrentan desafíos para comprender cuántos genes contribuyen a enfermedades como las que se observan en la diabetes o la esquizofrenia. El Instituto de Ciencia y Tecnología de Austria (ISTA) ha publicado un nuevo estudio. PNASse ocupa de este problema.
Muchos modelos y algoritmos estadísticos utilizados por los científicos pueden considerarse “cajas negras”. Estos modelos son herramientas poderosas que hacen predicciones precisas, pero su funcionamiento interno no es fácilmente interpretable ni comprendido. En una era dominada por el aprendizaje profundo, donde se pueden procesar cantidades cada vez mayores de datos, Natalya Ruzikova, física y estudiante de doctorado en el Instituto de Ciencia y Tecnología de Austria (ISTA), dio un paso adelante. Al menos en el contexto del análisis de datos genómicos.
Junto con Michal Hledík, recién graduado de ISTA, y el profesor Gašper Tkačik, Ružičková ha propuesto un modelo que puede ayudar a analizar “enfermedades poligénicas”, en las que muchas regiones del genoma son defectuosas. Además, trabaja para entender el modelo. por qué Las regiones genómicas identificadas contribuyen a estas enfermedades. Lo hacen combinando análisis sofisticados del genoma con conocimientos de biología básica. Los resultados se publican en PNAS.
Decodificando el genoma humano
En 1990, se lanzó el Proyecto Genoma Humano para decodificar completamente el ADN humano, el modelo genético que define a los humanos. Un avance rápido hasta 2003, cuando se completó el proyecto, allanó el camino para muchos avances en ciencia, medicina y tecnología. Al comprender el código genético humano, los científicos esperaban aprender más sobre mutaciones específicas y enfermedades asociadas con mutaciones en este guión genético. Dado que el genoma humano contiene alrededor de 20.000 genes e incluso más pares de bases (las letras del modelo), se hizo necesario un gran poder estadístico. Esto llevó al desarrollo de los llamados “estudios de asociación de todo el genoma” (GWAS).
GWAS aborda este problema identificando variantes genéticas potencialmente asociadas con rasgos biológicos como la altura. Es importante destacar que también incluyen la tendencia a diversas enfermedades. Para ello, el principio estadístico básico es bastante sencillo: los participantes se dividen en dos grupos: individuos sanos y enfermos. Luego se analiza su ADN para detectar mutaciones (cambios en su genoma) que son más prominentes en los afectados por la enfermedad.
Interacción de genes
Cuando surgieron los estudios de asociación de todo el genoma, los científicos esperaban encontrar sólo unas pocas mutaciones en genes conocidos asociados con una enfermedad que explicarían las diferencias entre individuos sanos y enfermos. La realidad, sin embargo, es mucho más complicada. “A veces, cientos o miles de mutaciones están asociadas a una enfermedad concreta”, afirma Ružičková. “Esta fue una revelación sorprendente y contradijo la comprensión de la biología que tenemos”.
Individualmente, cada mutación tiene un efecto mínimo o contribuye al riesgo de desarrollar la enfermedad. Sin embargo, en conjunto, pueden explicar mejor, aunque no completamente, por qué algunas personas desarrollan la enfermedad. Estas enfermedades se denominan “poligénicas”. Por ejemplo, la diabetes tipo 2 es poligénica, ya que no puede atribuirse a un solo gen. En cambio, incluye cientos de variaciones. Algunas de estas mutaciones afectan la producción de insulina, la acción de la insulina o el metabolismo de la glucosa, mientras que la mayoría se ubican en regiones genómicas no asociadas previamente con la diabetes o funciones biológicas desconocidas.
El modelo omnigénico
En 2017, Evan A. Boyle y sus colegas de la Universidad de Stanford propusieron un nuevo marco conceptual llamado “modelo omnigénico”. Propusieron una explicación de por qué tantos genes contribuyen a la enfermedad: las células tienen redes reguladoras que conectan genes con diversas funciones.
“Dado que los genes están interconectados, una mutación en un gen puede afectar a otro, ya que el efecto mutacional se propaga a través de la red reguladora”, explica Ružičková. Debido a estas redes, muchos genes del sistema regulador contribuyen a una enfermedad. Sin embargo, hasta ahora, este modelo no ha sido formulado matemáticamente y ha sido una hipótesis conceptual difícil de probar. En su último artículo, Ružičková y sus colegas presentan una nueva formalización matemática basada en el modelo omnigénico llamado “modelo omnigénico cuantitativo” (QOM).
Integrando estadística y biología
Para demostrar el potencial del nuevo modelo, necesitaban aplicar el marco a un sistema biológico bien caracterizado. Eligieron el modelo de levadura de laboratorio normal. Saccharomyces cerevisiaeconocido como levadura de cerveza o Levadura de panadería. Es un eucariota unicelular, lo que significa que su estructura celular es similar a la de organismos complejos como los humanos. “En la levadura conocemos bastante bien cómo se forman las redes reguladoras que conectan los genes”, afirma Ružičková.
Utilizando su modelo, los científicos predijeron los niveles de expresión genética (la intensidad de la actividad genética, que indica cuánta información del ADN se utiliza activamente) y cómo la variación reguladora de la levadura se propaga a través de la red. Las predicciones fueron extremadamente útiles: el modelo no sólo identificó los genes relevantes, sino que también identificó claramente qué mutaciones probablemente contribuyeron a un resultado particular.
Piezas del rompecabezas de las enfermedades poligénicas
El objetivo de los científicos no era superar el GWAS estándar en rendimiento predictivo, sino ir en una dirección diferente haciendo que el modelo fuera más interpretable. Mientras que un modelo GWAS estándar actúa como una “caja negra”, proporcionando una cuenta estadística de la frecuencia con la que una mutación particular se asocia con una enfermedad, el nuevo modelo utiliza un enfoque causal de cadena de eventos. cómo Ese cambio puede provocar enfermedades.
En medicina, comprender el contexto biológico y encontrar nuevas opciones terapéuticas para dichas vías funcionales tiene enormes implicaciones. Aunque el modelo está actualmente lejos de cualquier aplicación clínica, muestra potencial, especialmente para aprender más sobre enfermedades poligénicas. “Si se sabe lo suficiente sobre las redes reguladoras, se pueden construir modelos similares para otros organismos. Observamos la expresión genética en la levadura, que es sólo el primer paso y la prueba del principio. Ahora que entendemos lo que es posible, podemos empezar a pensar en la aplicación de la genética humana”, afirma Ružičková.