La inteligencia artificial sigue abriéndose camino en muchos aspectos de nuestras vidas. Pero ¿qué pasa con la biología, el estudio de la vida misma? La IA puede examinar millones de puntos de datos del genoma para identificar posibles nuevos objetivos terapéuticos. Si bien estos conocimientos genómicos pueden ser útiles, los científicos no están seguros de cómo los modelos de IA actuales llegan a sus conclusiones en primer lugar. Ahora, ha surgido un nuevo sistema llamado SQUID armado para desbloquear la caja negra de la profunda lógica interna de la IA.
SQUID, abreviatura de Interpretabilidad cuantitativa sustituta para Deepnets, es una herramienta computacional desarrollada por científicos del Laboratorio Cold Spring Harbor (CSHL). Está diseñado para ayudar a interpretar cómo los modelos de IA analizan los genomas. En comparación con otras herramientas de análisis, SQUID es más consistente, reduce el ruido de fondo y puede hacer predicciones más precisas sobre los efectos de la variación genética.
¿Cómo funciona tan bien? El profesor asistente de CSHL, Peter Coe, dice que la clave está en el entrenamiento especial del SQUID.
“La mayoría de las herramientas que la gente usa para tratar de comprender estos modelos provienen de otros campos como la visión por computadora o el procesamiento del lenguaje natural. Si bien pueden ser útiles, no son óptimas para la genómica. “Lo que hicimos con SQUID fue aprovechar décadas de experiencia. conocimientos de genética cuantitativa para ayudarnos a comprender lo que aprenden estas redes neuronales profundas”, explica Ko.
SQUID funciona construyendo primero una biblioteca de más de 100.000 secuencias de ADN diferentes. Luego analiza la biblioteca de variantes y sus efectos utilizando un programa llamado MAVE-NN (Multiplex Assays of Variant Effects Neural Network). La herramienta permite a los científicos realizar miles de experimentos virtuales simultáneamente. De hecho, pueden “pescar” el algoritmo detrás de las predicciones más precisas de una IA determinada. Su “captura” computacional puede sentar las bases para experimentos más basados en la realidad.
“Los experimentos in silico (virtuales) no sustituyen a los experimentos reales de laboratorio. Sin embargo, pueden ser muy informativos. Pueden ayudar a los científicos a formular hipótesis sobre cómo funciona un genoma, cómo funciona una región particular o cómo un cambio podría tener un efecto clínicamente relevante. ” explica el profesor asociado de CSHL Justin Kinney, coautor del estudio.
Hay muchos modelos de IA en el océano. Cada día entran más al agua. Koo, Kinney y sus colegas esperan que SQUID ayude a los científicos a capturar aquellos que mejor satisfagan sus necesidades especiales.
Aunque cartografiado, el genoma humano es un terreno increíblemente desafiante. SQUID puede ayudar a los biólogos a navegar en este campo de manera más efectiva, acercándolos a las implicaciones clínicas reales de sus hallazgos.