Home Smartwatch La IA ‘calculada’ rompe el lenguaje secreto de las proteínas pegajosas

La IA ‘calculada’ rompe el lenguaje secreto de las proteínas pegajosas

2

Un dispositivo de IA ha dado un paso adelante para traducir el uso de la proteína de la lengua para que se ordene si están asociados con la enfermedad de Alzheimer y forman clips pegajosos como otros cincuenta tipos de enfermedades humanas. Al desviarse de los modelos de IA de “caja negra” comunes, una nueva herramienta, Cana, se permitió explicar sus decisiones, que revela muestras químicas específicas que funcionan o evitan el plegamiento de proteínas nocivas.

Gracias al mayor Datastate de la colección de proteínas hasta la fecha, este descubrimiento fue posible hoy en la revista Science Advanced. El estudio ofrece nuevas ideas sobre los mecanismos moleculares que reducen las proteínas pegajosas, que están vinculadas a dolencias que afectan a medio billón de personas en todo el mundo.

El grupo de proteínas, o la recolección de amaloides, es un riesgo para la salud que interrumpe la función celular normal. Cuando algunos parches en la proteína se adhieren entre sí, la proteína crece en las fibras densas que tienen consecuencias patológicas.

Aunque este estudio tiene algunas implicaciones para acelerar los esfuerzos de investigación para enfermedades neurodegenerativas, tendrá un efecto más rápido en la biotecnología. Muchos medicamentos son proteínas, y a menudo se obstruyen por la rotación no deseada.

“La recolección de proteínas es un dolor de cabeza importante para las compañías farmacéuticas”, dice el Dr. Bendata Bolunyi, autor cooperativo del Instituto de Ingeniería Biochania de Cataluña (IBEC).

Agregó: “Si el tratamiento comienza a recolectar proteínas, la fabricación puede fallar, lo que cuesta tiempo y dinero. Kenia puede ayudar a guiar los anticuerpos y enzimas, lo que puede ayudar a vivir juntos y reducir las fallas costosas en el proceso”.

Los indicadores de proteínas se crean utilizando el lenguaje que se considera defectuoso. La base de proteínas está hecha de diferentes tipos de aminoácidos. Por lo general, las letras A, C, G, T que hacen el lenguaje del ADN, tienen veinte letras diferentes en un lenguaje de proteína, que combinan diferentes palabras, “palabras” o “formas”.

Los investigadores han estado tratando de entender durante mucho tiempo que la combinación de mapas causa y eso puede agregar otras proteínas sin ningún error. Las herramientas de inteligencia artificial que tratan los aminoácidos pueden ayudar a identificar palabras o mapas responsables como el misterioso alfabeto del lenguaje, pero la calidad y el volumen del volumen de la proteína requerida para alimentar a los modelos se limitan históricamente a piezas de proteínas muy bajas o muy pequeñas.

Esta investigación ha resuelto el desafío de experimentos generalizados. Los autores de este estudio hicieron más de 100,000 piezas de proteínas aleatorias completas desde el principio, cada 20 aminoácidos son largos. Cada pieza artificial se probó en las células de la levadura viviente. Si una pieza en particular ha movilizado la formación de la bandera, las células de la levadura se desarrollarán de cierta manera, que los investigadores pueden medir para determinar el efecto y el efecto.

Una de cada cinco piezas de proteína (21,936/100,000) causó el aglomerado, mientras que no el resto. Aunque se han detectado estudios previos un puñado de series, el nuevo Datastate recibe un gran catálogo de varias variaciones de proteínas que pueden causar depósito de amaloides.

“Realmente hemos hecho piezas de proteínas aleatorias, incluidas muchas versiones que no se han encontrado en la naturaleza. La evolución acaba de formar parte de todas las series de proteínas posibles, mientras que nuestro enfoque ayuda en una gran galaxia de posibilidades, lo que ayuda a ayudar a recopilar muchos puntos de datos”.

Se utilizaron una gran cantidad de datos producidos a partir de los experimentos para el entrenamiento de canon. Los investigadores decidieron crearlo utilizando los principios de “explicación AI”, lo que podría hacer que su proceso de decisión sea transparente y comprensible para los seres humanos. Esto significa sacrificar un poco de sus predicciones, que generalmente es más alta en la AIS de “caja negra”. Sin embargo, Kenia demostró ser un 15 % más preciso que los modelos actuales.

Específicamente, Kenia es un modelo conductor, una herramienta híbrida que toma prestado de dos esquinas separadas de IA. Los modelos de confusión, como la identidad de la imagen, se utilizan para escanear fotos de fotos de identificación facial, como la oreja o la nariz de la Anna, excepto para encontrar características significativas como defectos o “palabras” a través de la cadena de proteínas Kenia.

Los modelos de atención AI usan herramientas de traducción de idiomas para identificar frases clave en una oración antes de decidir la mejor traducción. Los investigadores agregaron esta técnica para ayudar a Kenia a descubrir qué motivaciones son las más importantes en todo el esquema de proteínas.

Simultáneamente, ambos puntos de vista ayudan a Kenia a mirar de cerca los mapas locales, mientras que también valora su gran panorama. Los investigadores no pueden simplemente predecir esta información que los mapas en China pueden alentar, bloquear o alentar algo entre ella, sino también para comprender que esta es la razón.

Por ejemplo, Kenia muestra que los pequeños bolsillos de aminoácidos ricos en agua tienen más probabilidades de aferrarse al sujeción, mientras que algunos mapas tienen un mayor impacto en el recorte si se están acercando al comienzo del ajuste de proteínas en lugar del final. Los investigadores han visto observaciones asociadas con resultados anteriores bajo microscopio en fibras amaloides conocidas.

Pero Kenia también recibió nuevas reglas para ejecutar depósitos de proteínas. Por ejemplo, algunos de los bloques de construcción de proteínas, por lo tanto, se cree que los aminoácidos cargados llamados, generalmente detienen la rotación. Pero resulta que en el contexto de otros bloques de construcción específicos, de hecho pueden promover el grupo.

En su forma actual, Kenia describe principalmente la acumulación de proteínas en términos de sí o no, es decir, actúa como una “clasificación” llamada así. Los próximos investigadores quieren mejorar el sistema para que puedan predecir y comparar la velocidad de acumulación en lugar de solo la posibilidad de acumulación. Esto puede ayudar a adivinar qué variaciones de proteínas se forman rápidamente y qué funcionan más lentamente, un elemento importante de las enfermedades neurodigánicas donde el tiempo de formación de amaloides es tan importante como es.

“Hay 1024 formas quintales de hacer un pedazo de proteína, que tiene 20 aminoácidos de altura. Hasta ahora, solo hemos entrenado una IA con solo 100,000 piezas. Queremos mejorarla haciendo piezas más y grandes. Este es el primer paso, pero nuestro trabajo muestra que es posible que comprendamos la humanidad.

“Este proyecto es un buen ejemplo de cómo la generación de datos a gran escala puede acelerar la investigación conectando la IA. Esta es una forma muy efectiva de generar datos”, el Centro para la Regulación Genómica (CRG) y el Co -Autor del Instituto Científico de Bienvenido y Co -Author y líder grupal.

“Usando la síntesis y diseños de ADN, podemos hacer cientos de miles de experimentos en el mismo tubo, lo que puede producir los datos que necesitamos para entrenar modelos AI. Este es un enfoque que estamos aplicando a muchos problemas difíciles en biología. Su objetivo es hacer pronósticos de biología”.

Este estudio es una cooperación conjunta del laboratorio del profesor Ben Lehner de ICREA Research, que se encuentra en el laboratorio del Centro para la Regulación Genómica (CRG) y el Laboratorio de Bio -Engineación de Cataluña (IBEC) de Benadata Bolunye. Investigadores en el Laboratorio de Harbour de Cold Spring (CSHL) y el Bienvenido Instituto de Ciencias también contribuyeron al estudio. Fue financiado por la Fundación de Investigación “La Kaxa”, el Consejo Europeo de Investigación y el Ministerio de Ciencia e Innovación de Español.

Source link