Home Smartwatch Con IA generativa, los químicos calculan inmediatamente las estructuras genómicas 3D

Con IA generativa, los químicos calculan inmediatamente las estructuras genómicas 3D

44
0

Cada célula de su cuerpo tiene la misma continuidad genética, pero cada célula expresa solo un subset de estos genes. Estas muestras de expresión génica relacionada con las células, que se aseguran de que las células cerebrales sean diferentes de las células de la piel, están parcialmente determinadas por la estructura de tres dimensiones de la sustancia genética, que para cada genes.

Los químicos del MIT ahora han traído una nueva forma de determinar estas estructuras del genoma 3D utilizando inteligencia artificial genérica. Sus técnicas solo pueden predecir miles de estructuras en minutos, lo que es mucho más rápido que las formas experimentales actuales de analizar la estructura.

Utilizando esta técnica, los investigadores pueden estudiar fácilmente cómo la organización 3D del genoma afecta las muestras y funciones de la expresión de células individuales.

“Nuestro objetivo era predecir las estructuras del genoma de tres dimensiones a partir de la continuidad básica del ADN”, dice Bin Zhang, profesor asociado de química y autor principal del estudio. “Ahora que podemos hacerlo, lo que hace que esta técnica sea equivalente a las técnicas experimentales modernas, puede abrir muchas oportunidades interesantes”.

Los estudiantes graduados del MIT Greg Schoutet y Zohan Lao son el autor principal de esta disertación, que aparece hoy Desarrollo científico.

De la secuencia a la estructura

Dentro del núcleo celular, el ADN y la proteína forman un complejo llamado cromatina, que tiene varios niveles de la organización, lo que permite a las células penetrar 2 metros de ADN en un núcleo que solo un mm de diámetro hay un sueco. Proteína alrededor del aire de ADN -largo alto alto alto alto alto alto alto tah lol tah lol tall tah lol tah lol tah tah lol tah lol tah lol tah lol tah l largo alto alto alto alto tah lol tah lol tah lol tah tah tah lol tah lol tah lol tah lol tah lol tah l largo alto alto alto alto tah lol tall tah lol tall tah lol tah lol tah lol tah lol

Las etiquetas químicas se conocen como modificación epigénica que puede asociarse con ADN en ubicaciones específicas, y estas etiquetas, que varían del tipo de célula, afectan el plegamiento de la cromatina y los genes cercanos. Estas diferencias en la formación de la cromatina ayudan a determinar qué genes se expresan en diferentes tipos de células, o en diferentes momentos dentro de la célula dada.

En los últimos 20 años, los científicos han desarrollado una técnica experimental para determinar la estructura de la cromatina. Una técnica ampliamente utilizada, conocida como HI-C, trabaja en conjunto para conectar el ADN del vecindario en el núcleo celular. Los investigadores pueden determinar qué clases se encuentran cerca una de la otra cortando el ADN en muchas piezas pequeñas y configurándolo.

Este procedimiento se puede usar en una gran población de células para calcular la estructura promedio para cualquier parte de la cromatina para determinar la estructura dentro de esta célula específica. Sin embargo, el HI-C, etc., están trabajando duro, y puede llevar aproximadamente una semana producir datos de una celda.

Para superar estos límites, Jong y sus alumnos desarrollaron un modelo que beneficie el progreso reciente en la IA generativa para crear una forma rápida y precisa de predecir la estructura de la cromatina en una célula. El modelo de IA que ha desarrollado puede analizar rápidamente la configuración de ADN y predecir la estructura de cromatón que pueden producir en la célula de la serie.

Zhang dice que “la educación profunda en la identidad del patrón es realmente buena”. ?

El modelo que los investigadores han desarrollado son dos componentes del cromógeno. El primer componente, un modelo de aprendizaje profundo enseña al genoma a “leer”, analiza la continuidad del ADN básica y las filtraciones de cromatitina analizada información, analizando información, que está ampliamente disponible y la celda está relacionada con el tipo.

El segundo componente es un modelo de IA generativo que predice una secuencia de cromatina físicamente correcta, que ha sido entrenada en más de 11 millones de formas de cromatina. Estas figuras se hicieron a partir de experimentos usando una línea de linfosis humana en 16 células usando una inmersión (forma diferente de HI-C).

Cuando se integra, el primer componente informa el modelo de producción cómo el entorno del tipo de célula afecta la formación de una estructura de cromatina diferente, y el esquema captura efectivamente la relación de la estructura de continuidad. Para cada entorno, los investigadores usan su modelo para producir muchas estructuras potenciales. La razón de esto es que el ADN es una molécula muy desagradable, por lo que la misma continuidad del ADN puede dar lugar a muchas formas potenciales diferentes.

“Un factor complejo importante para predecir la estructura del genoma es que no hay una solución a la que tengamos la intención. Tiene una división de estructura, ya sea que vea qué parte del genoma. Eso predijo que mucha predicción dice que el complejo y alto y alto -La distribución estadística dimensional es algo increíblemente difícil de hacer.

Análisis de suministro

Una vez entrenado, el modelo puede producir predicciones en una escala de tiempo más rápida que HI-C u otras técnicas experimentales.

“Aunque solo puede hacer solo seis meses de experiencias para obtener una docena de estructuras en un tipo de célula determinada, solo usted en una GPU en una región en particular con nuestro modelo puede producir mil estructuras en una región en particular”.

Después de entrenar su modelo, los investigadores lo usaron para crear predicciones de estructura para más de 2,000 continuidad de ADN, luego las compararon con una estructura experimentalmente fija para estos entornos. Encontró que las estructuras producidas por el modelo se observaron en los mismos o muy similares datos experimentales.

“Por lo general, observamos cientos o miles de formas para cada continuación, y le da una representación razonable de la estructura de una región particular”, dice Zhang. “Si repite su experiencia varias veces, en diferentes células, es probable que sea muy diferente. Esto es lo que está tratando de predecir nuestro modelo”.

Los investigadores también encontraron que el modelo podría hacer predicciones precisas para los datos de tipos de células que fueron capacitados. Esto muestra que el modelo puede ser útil para analizar cómo las estructuras de la cromatina son diferentes entre los tipos de células y cómo estas diferencias afectan su trabajo. Este modelo también se puede utilizar para descubrir diferentes estados de cromatina que pueden estar presentes en la misma célula, y que los cambios afectan la expresión del gen.

Otra aplicación potencial será descubrir cómo los cambios en una continuidad de ADN particular cambian la formación de la cromatina, que puede arrojar luz sobre tales variaciones.

“Hay muchas preguntas interesantes sobre las que creo que podemos abordar este tipo de modelo”, dice Zhang.

Los investigadores han puesto a disposición todos sus datos y modelos para otros que desean usarlos.

Esta investigación fue proporcionada por los Institutos Nacionales de Salud.

Source link