De la misma manera que ChatGPT entiende el lenguaje humano, un nuevo modelo de IA desarrollado por biólogos computacionales de Columbia captura el lenguaje de las células para predecir con precisión su actividad.
Utilizando un nuevo método de inteligencia artificial, investigadores del Colegio de Médicos y Cirujanos Vajillos de la Universidad de Columbia pueden predecir con precisión la actividad genética dentro de cualquier célula humana, revelando esencialmente los mecanismos internos de la célula. sistema, se describe en la edición actual de la naturalezaPodría cambiar la forma en que los científicos trabajan para comprender todo, desde el cáncer hasta las enfermedades genéticas.
“Los modelos computacionales generales predictivos permiten desentrañar procesos biológicos de manera rápida y precisa. Estos métodos pueden realizar de manera eficiente experimentos computacionales a gran escala, aumentar y guiar los enfoques experimentales tradicionales”, dice Raúl Rabadan, profesor de biología de sistemas y autor principal. Papel
Los métodos tradicionales de investigación en biología son buenos para mostrar cómo las células realizan sus funciones o reaccionan ante perturbaciones. Pero no pueden predecir cómo funcionan las células o cómo reaccionarán ante un cambio, como una mutación que causa cáncer.
“Tener la capacidad de predecir con precisión la actividad de una célula transformará nuestra comprensión de los procesos biológicos fundamentales”, afirma Rabdan. “Esto transformará la biología de una ciencia que describe procesos aparentemente aleatorios a una que puede predecir los sistemas fundamentales que gobiernan el comportamiento celular”.
En los últimos años, la acumulación de datos a gran escala procedentes de células y modelos de IA más potentes está empezando a transformar la biología en una ciencia más predictiva. El Premio Nobel de Química 2024 fue otorgado a investigadores por su trabajo innovador en el uso de la IA para predecir estructuras de proteínas. Pero utilizar métodos de IA para predecir las actividades de genes y proteínas dentro de las células ha resultado más difícil.
Un nuevo método de IA predice la expresión genética en cualquier célula.
En el nuevo estudio, Rabadan y sus colegas intentaron utilizar la IA para predecir qué genes están activos dentro de células específicas. Esta información sobre la expresión genética puede informar a los investigadores sobre la identidad celular y cómo la célula realiza sus funciones.
“Los modelos anteriores se han entrenado con datos de tipos específicos de células, generalmente líneas celulares cancerosas o algo que se parece poco a las células normales”, dice Rabadan. Zhi Fu, un estudiante de posgrado en el laboratorio de Rabadan, decidió adoptar un enfoque diferente, entrenando un modelo de aprendizaje automático con datos de expresión genética de millones de células obtenidas de tejido humano normal. Las entradas consisten en secuencias del genoma y datos que muestran qué partes del genoma son accesibles y expresadas.
El enfoque general es similar a cómo funcionan ChatGPT y otros modelos “fundamentales” populares. Estos sistemas utilizan un conjunto de datos de entrenamiento para identificar reglas básicas, la gramática de un idioma, y luego aplican estas reglas inferidas a situaciones nuevas. “Aquí es exactamente lo mismo: aprendemos gramática en muchos estados celulares diferentes, y luego vamos a un estado particular (puede ser un tipo de célula enferma o normal) y podemos intentar ver qué tan bien predecir patrones a partir de esta información”, dice Rabadan.
Fu y Rabadan pronto formaron un equipo de colegas, incluido el coautor Alejandro Buendía, ahora estudiante de doctorado en Stanford en el primer laboratorio de Rabadan, y Shentong Mo de Carnegie Mellon, quien entrenó el nuevo modelo para realizar pruebas.
Después de entrenar con datos de más de 1,3 millones de células humanas, el sistema se volvió lo suficientemente preciso como para predecir la expresión genética en tipos de células que nunca había visto, resultados que coincidían con los datos experimentales.
Nuevos métodos de IA revelan las causas del cáncer infantil
A continuación, los investigadores demostraron el poder de su sistema de inteligencia artificial cuando le pidieron que descubriera la biología aún oculta de las células enfermas, en este caso, una forma hereditaria de leucemia pediátrica.
“Estos niños heredan un gen que está mutado, y no estaba exactamente claro qué estaban haciendo las mutaciones”, dice Rabadan, codirector del Programa de Investigación de Genómica y Epigenómica del Cáncer en el Centro Integral del Cáncer Herbert Irving de Columbia.
Con la IA, los investigadores predijeron que las mutaciones alteran la interacción entre dos factores de transcripción diferentes que determinan el destino de las células leucémicas. Los experimentos de laboratorio confirmaron las predicciones de la IA. Comprender el efecto de estas mutaciones revela los mecanismos específicos que impulsan la enfermedad.
La IA puede revelar “materia oscura” en el genoma.
Los nuevos métodos computacionales también deberían permitir a los investigadores comenzar a explorar el papel de la “materia oscura” del genoma, un término tomado de la cosmología que se refiere a la gran mayoría del genoma, que se sabe que no codifica genes. .
“La mayoría de las mutaciones encontradas en pacientes con cáncer ocurren en las llamadas regiones oscuras del genoma. Estas mutaciones no afectan la función de una proteína y permanecen en gran medida sin descubrir”. dice Rabadan. “La idea es que utilizando estos modelos podamos buscar mutaciones e iluminar esa parte del genoma”.
Rabadan ya está trabajando con investigadores de Columbia y otras universidades, explorando una variedad de cánceres, desde el cerebro hasta los de la sangre, aprendiendo la gramática de la regulación en las células normales y los procesos de crecimiento del cáncer.
El trabajo también abre nuevas vías para comprender muchas enfermedades más allá del cáncer e identificar objetivos potenciales para nuevas terapias. Al proyectar nuevas mutaciones en un modelo informático, los investigadores ahora pueden obtener conocimientos y predicciones más profundos sobre cómo estas mutaciones afectan a la célula.
Siguiendo otros avances recientes en inteligencia artificial para la biología, Rabadan ve este trabajo como parte de una tendencia más amplia: “Es realmente una nueva era en la biología que es muy emocionante; hacer de la biología una ciencia predictiva del cambio”.










