Home Smartwatch La IA entrenada según el manual de la evolución produce proteínas que...

La IA entrenada según el manual de la evolución produce proteínas que impulsan el descubrimiento de fármacos y el descubrimiento científico.

161
0

Un nuevo modelo de inteligencia artificial desarrollado por investigadores de la Universidad de Texas en Austin allana el camino para tratamientos más eficaces y menos tóxicos y nuevas estrategias de prevención en medicina. Los modelos de IA aprovechan la lógica fundamental de los procesos evolutivos de la naturaleza para informar las terapias basadas en proteínas y el diseño de vacunas.

El avance de la IA, llamado EvoRank, ofrece un ejemplo nuevo y concreto de cómo la IA puede ayudar a impulsar cambios disruptivos en la investigación biomédica y la biotecnología en general. Los científicos describieron el trabajo en la Conferencia Internacional sobre Aprendizaje Automático y publicaron un artículo relacionado. Comunicaciones de la naturaleza Acerca de aprovechar marcos de IA más amplios para identificar mutaciones útiles en proteínas.

Un obstáculo importante en el diseño de mejores biotecnologías basadas en proteínas es tener suficientes datos experimentales sobre proteínas para entrenar adecuadamente modelos de IA para comprender cómo funcionan proteínas específicas y así identificarlas para fines específicos. La idea clave de EvoRank es aprovechar la variación natural de millones de proteínas que han evolucionado con el tiempo y extraer la dinámica fundamental necesaria para soluciones viables a los desafíos biotecnológicos.

“La naturaleza ha estado produciendo proteínas durante 3 mil millones de años, reemplazando o reemplazando los aminoácidos y los seres vivos”, dijo Daniel Díaz, científico investigador en ciencias de la computación y copresidente del Grupo Deep Proteins. Licenciatura en informática y química en UT. “EvoRank aprende cómo clasificar la evolución que observamos a nuestro alrededor, esencialmente desenterrando las reglas que determinan la evolución de las proteínas y usando esas reglas para crear otras nuevas. Puede guiar el desarrollo de aplicaciones basadas en proteínas, incluido el desarrollo de fármacos y para una amplia gama con fines de biofabricación.”

UT es sede de uno de los programas líderes del país para la investigación de IA e incluye el Instituto para los Fundamentos del Aprendizaje Automático (IFML), financiado por la Fundación Nacional de Ciencias, dirigido por el profesor de ciencias de la computación Adam Clevans, quien en el Departamento también codirige proteínas. Hoy, la Agencia de Proyectos de Investigación Avanzada para la Salud anunció una subvención en colaboración con el Instituto de Inmunología de La Jolla para Proteínas Profundas y el desarrollador de vacunas Jason McClellan, profesor de biociencias moleculares de UT. El equipo de UT recibirá alrededor de 2,5 millones de dólares para comenzar a aplicar la IA a la investigación de ingeniería de proteínas para desarrollar una vacuna que combata el virus del herpes.

“Diseñar proteínas con capacidades que las proteínas naturales no tienen es un gran desafío recurrente en las ciencias biológicas”, dijo Klivans. “Este es también el tipo de trabajo para el que se construyen los modelos creativos de IA, ya que pueden sintetizar grandes bases de datos de bioquímica conocida y luego generar nuevos diseños”.

A diferencia de Alphafold de Google DeepMind, que aplica IA para predecir la forma y estructura de las proteínas en función de la secuencia de aminoácidos de cada individuo, los sistemas de IA de DeepProteins Group sugieren funciones específicas cómo realizar cambios óptimos en la proteína, como mejorar la flexibilidad. Se puede producir una proteína con nuevas biotecnologías.

El laboratorio de McLellan ya está sintetizando diferentes versiones de proteínas virales basadas en diseños generados por IA y luego está probando su estabilidad y otras propiedades.

“Los modelos han presentado alternativas en las que nunca pensamos”, dijo McLellan. “Funcionan, pero no son cosas que hubiéramos predicho, por lo que en realidad están buscando algún nuevo lugar para estabilizarse”.

Las terapias con proteínas a menudo tienen menos efectos secundarios y pueden ser más seguras y efectivas que las alternativas, y se proyecta que la industria mundial estimada en 400 mil millones de dólares hoy crecerá más del 50% durante la próxima década. Aún así, desarrollar un fármaco a base de proteínas es lento, costoso y arriesgado. Se estima que se necesitan mil millones de dólares o más para pasar del diseño de fármacos a los ensayos clínicos. Aun así, las probabilidades de que el nuevo medicamento de una empresa obtenga la aprobación de la Administración de Alimentos y Medicamentos son sólo de 1 entre 10. Además, para que sean útiles terapéuticamente, las proteínas a menudo necesitan ser modificadas genéticamente, por ejemplo, para garantizar su estabilidad. o permitirles alcanzar el nivel necesario para el desarrollo de fármacos, y las engorrosas pruebas y errores en los laboratorios han dictado tradicionalmente tales decisiones de ingeniería genética.

Si EvoRank, así como el marco relacionado basado en UT en el que se basa, Stability Oracle, se adapta comercialmente, proporcionará a la industria una hoja de ruta para llegar rápidamente a mejores diseños y desarrollo de fármacos. Habrá oportunidades para reducir el tiempo. y costos.

Utilizando una base de datos existente de secuencias de proteínas naturales, los investigadores que crearon EvoRank esencialmente generaron diferentes versiones de la misma proteína que se encuentra en diferentes organismos, desde estrellas de mar hasta robles y humanos, y las compararon. En cualquier punto dado de una proteína, puede haber uno de varios aminoácidos diferentes que la evolución ha encontrado útiles; la naturaleza selecciona, por ejemplo, el aminoácido tirosina el 36% de las veces, histidina el 29% de las veces, histidina el 14% de las veces. el tiempo. Lisina y, lo que es más importante, nunca El uso de esta mina de oro de leucina, los datos actuales, revela una lógica fundamental en la evolución de las proteínas. Los investigadores pueden eliminar opciones que, según la evolución, acabarían con la funcionalidad de la proteína. El equipo utiliza todo esto para entrenar nuevos algoritmos de aprendizaje automático. Basado en retroalimentación continua, el modelo aprende qué aminoácido eligió la naturaleza durante la evolución de las proteínas en el pasado, y basa su comprensión en qué es viable en la naturaleza y qué no.

A continuación, Díaz planea desarrollar una versión de “varias columnas” de EvoRank que pueda medir cómo múltiples mutaciones afectan la estructura y la estabilidad de las proteínas al mismo tiempo. También quiere desarrollar nuevas herramientas para predecir cómo se relaciona la estructura de una proteína con su función.

Además de Klivans y Diaz, el estudiante graduado en ciencias de la computación Chengyue Gong y el ex alumno de UT James M. Loy fueron coautores de ambos trabajos. Tianlong Chen y Qiang Liu también contribuyeron a EvoRank. Jeffrey Ouyang Zhang, David Yang, Andrew D. Ellington y Alex G. Demaux también contribuyeron al oráculo de la estabilidad. Esta investigación fue financiada por NSF, la Agencia de Reducción de Amenazas de Defensa y la Fundación Welch.

Source link