El trabajo de Google Dipmind con Alfafold no fue menos un milagro, pero es exhaustivamente costoso. Con esto en mente, los investigadores de Apple comenzaron el propósito de desarrollar un método alternativo para el uso de IA para predecir la estructura 3D de la proteína y se lo mostraron. Aquí están los detalles.
Si no estás familiarizado con AlfabetoEs un modelo de IA innovador de Google Dipmind que puede predecir la estructura 3D de la proteína a partir de su orden de aminoácidos. Es especialmente valioso para ayudar a desarrollar más materiales nuevos, así como drogas más efectivas.
Hasta hace unos años, era un problema increíblemente difícil. Puede llevar meses e incluso varios años predecir la estructura nuclear de tres dimensiones de una sola proteína.
Sin embargo, Alfafold y ahora gracias a Rosettefold y ESMfold, así como otros modelos sofisticados, así como otros modelos sofisticados, este proceso de predicción lleva menos de unas pocas horas o incluso unos minutos dependiendo del hardware.
Cada uno de estos modelos contrata sus propios métodos y marcos para lograr esta alta precisión nacional, pero generalmente necesitan cálculos extremadamente costosos y tienen una estructura muy estricta de sus marcos.
Los investigadores de Apple dicen:
“Los modelos de plegamiento de proteínas como Alfafold 2 y Rosettefold han advertido la arquitectura de ingeniería, que integra diseños compositivos específicos de dominio pesado para tareas de plegamiento de proteínas, como las secuencias de AA y las actualizaciones de MSA. Comprender el proceso de generación, en lugar de dejar que los modelos lo aprendan directamente, que pueden ser beneficiosos por varias razones”.
Ingrese el sencillo de Apple
En Modelo propuesto“MSA, pares de mapas de interacción, actualizaciones triangulares o cualquier otro módulos geométricos equivalentes dependen de los llamados modelos de coincidencia de flujo, que se introdujeron en 2023 y fueron muy populares para los modelos de texto a imagen y texto a 3D.
En resumen, los modelos coincidentes del flujo son una evolución de los modelos de cobertura en esta publicación. Sin embargo, en lugar de simplemente eliminar las palabras de la imagen inicial, han aprendido una ruta suave que convierte la palabra aleatoria en una figura terminada directamente.
Y dado que este método evita muchos pasos donantes, es menos costoso y produce los resultados rápidamente.

Los investigadores de Apple ofrecieron capacitación simple en múltiples formularios, incluidos los parámetros de 100 metros, 360m, 700m, 1.1b, 1.6b y 3b, y los han evaluado en dos estructuras proteicas ampliamente adoptadas: Comeio 22 y CASP 14, que se generalizan, una prueba y prueba de luz para la generalización.
Los resultados fueron muy prometedores:
“A pesar de su simplicidad, SimpleLd logled logró un rendimiento competitivo al comparar estas líneas de base. Ambos criterios mostraron un rendimiento consistentemente mejor que SimpleFloo, un modelo de combate de flujo construido con incrustaciones de ESM. CAMO 22, los modelos Simpolfold muestran los mejores modelos plegables, SMOFOLD 22, SMOP 22. Rosettefold 2/AlfaFold 2 en la mayoría de los métricos sin aplicar el TRIANGLG HURRISTISTICH.
Y
“Para la integridad, informamos los resultados de SimpleLd utilizando diferentes modelos. El modelo más pequeño muestra el rendimiento competitivo de las habilidades tanto en el entrenamiento y estimaciones de Simplephold -1m. En particular, Camero 2 simple logra más del 90% de las actuaciones, lo que muestra un modelo plegable de propósito general.

También vieron la mejora de las actuaciones integradas con la escala, lo que significa modelos más grandes, incluidos más datos de capacitación, proporcionan un mejor rendimiento de pliegue, especialmente en los criterios más desafiantes.
Finalmente, se dan cuenta de que Simplefold es simplemente el primer paso, y dicen que “la esperanza (es) actúa como una iniciativa para que la comunidad cree modelos de generadores de proteínas calificados y fuertes”.
Puedes leer Estudio completo de RCEVEl