Escuche las primeras notas de la vieja y querida canción. ¿Puedes nombrar esta melodía? Si puede, felicidades: esta es la victoria de su memoria asociada, que desencadena una información (primero algunas notas) la memoria de patrón (canción) completa, sin realmente necesitas escuchar el resto de la canción. Utilizamos este simple método nervioso para aprender, recordar, resolver problemas y nutrir nuestra realidad.
“Este es el efecto de una red”, dijo, y agregó que los recuerdos asociados no se almacenan en las únicas células del cerebro, dijo Francisco Blu, profesor de Ingeniería Mecánica de UC Santa Bárbara. “El almacenamiento de memoria y la recuperación de la memoria son procesos dinámicos que se encuentran en toda la red de neuronas”.
En 1982, el físico John Hopfield, con la formación de la red de Hopfield, tradujo el concepto de neurociencias teóricas a la inteligencia artificial. Al hacerlo, no solo proporcionó un marco matemático para comprender el almacenamiento y la recuperación de la memoria en el cerebro humano, sino que también desarrolló una de las redes nerviosas artificiales repetidas, la red de campo HOP, que es la capacidad de recuperar muestras completas de ruido o entradas incompletas. Hopfield ganó el Premio Nobel por su trabajo en 2024.
Sin embargo, según Blu y su compañero Simon Bateety, Jiacomo Baggio y Sandro Zamperi en la Universidad de Padua, Italia, el modelo tradicional de la red de campo de lúpulo es poderoso, pero toda la historia no cuenta cómo la nueva información guía la recuperación de la memoria. “En particular”, dice en una disertación publicada en la revista científica Advanced, “se ha revelado en gran medida el papel de los insumos externos, con sus efectos en su dinámica neurológica, a la eficacia que hacen la recuperación de la memoria efectiva”. Los investigadores recomiendan un modelo de recuperación de la memoria, que dicen, cómo experimentamos la memoria.
Blu explicó: “La versión moderna del sistema de aprendizaje automático, este gran modelo de lenguaje: realmente no modelan recuerdos”. “Has dado un gesto y sales. Pero este no es el que entendemos y manejamos recuerdos en el mundo de los animales”. Aunque los LLM pueden devolver la reacción que se puede convencer, destacando los patrones del lenguaje que se les alimenta, aún carecen del razonamiento básico y la experiencia del mundo real físico que tienen los animales.
“La forma en que experimentamos el mundo es algo más permanente y menos iniciado y menos”. Agregó que la mayor parte del tratamiento en el modelo Hopfield trata el cerebro como si fuera una computadora. “En cambio, dado que estamos trabajando en el modelo de memoria, queremos comenzar desde un punto de vista humano”.
La pregunta básica que influye en las ideologías fue: a medida que experimentamos el mundo que nos rodea, ¿cómo encontramos indicadores que nos hacen recuperar recuerdos?
Como Hopfield ha imaginado, es útil imaginar la recuperación de la memoria en términos de paisaje energético, en el que los valles son efectivos que representan recuerdos. La recuperación de la memoria es como buscar el paisaje. La identificación ocurre cuando caes en uno de los valles. Su posición inicial en el paisaje es su posición inicial.
Blue dijo: “Solo imagina que ves la cola de un gato”. “No solo todo el gato, sino solo la cola. Un sistema de memoria asociado debería poder recuperar la memoria de todo el gato”. Según el modelo de campo de lúpulo tradicional, la cola del gato (estimulante) es suficiente para mantenerte cerca del valle de la etiqueta del “gato”, dijo, tratando el estímulo como un estado preliminar. Pero, ¿cómo llegaste por primera vez a este lugar?
Blue dijo: “El modelo de campo clásico de lúpulo no explica cuidadosamente que la cola del gato te coloca en el lugar correcto para caer de la colina y alcanzar la menor energía”. “¿Cómo deambulas la actividad nerviosa donde estás almacenando estos recuerdos? No está un poco claro”.
El modelo de plástico de entrada (IDP) de los investigadores tiene como objetivo resolver la falta de explicación con un mecanismo que integra gradualmente la información pasada y nueva, lo que atrae el proceso de recuperación de la memoria a la memoria correcta. En lugar de aplicar la recuperación de memoria algorítmica de dos pasos a escenas de energía estables en lugar del modelo original de red Hopfield, los investigadores explican un método de entrada dinámico.
“Abogamos por la idea de que tan pronto como se recibe el estímulo del mundo exterior (como el ícono del gato), cambia el panorama energético al mismo tiempo”, dijo Blu. “La estimulación simplifica el panorama energético para que cuál sea su posición inicial, estará en el recuerdo correcto del gato”. Además, dicen los investigadores, el modelo IDP es fuerte para el ruido. En situaciones donde la entrada es ambigua, vago o parcialmente vago, y de hecho usa el ruido como un medio para filtrar recuerdos menos estables (menos valles de este paisaje energético) a favor de ser más estable.
“Comenzamos con el hecho de que cuando miras una escena, tus ojos cambian entre diferentes componentes de la escena”. “Así que todo el tiempo que eliges concentrarte en el que quieres concentrarte, pero hay mucho ruido a tu alrededor”. Explicó que una vez que está bloqueado para concentrarse en la entrada, la red se ajusta para priorizarse.
Otra arquitectura de la red neuronal, incluso detrás del transformador, para centrarse en qué estimulación enfocarse, se ha convertido en el corazón de modelos de idiomas grandes como Chat GPT. Blue dijo, aunque los investigadores del modelo IDP sugirieron que “comienza con un punto de partida muy diferente con un propósito diferente”, dijo Blu, dijo Blue, el futuro sistema de aprendizaje automático del modelo tiene un gran potencial para ser útil en el diseño.
“Veamos una relación entre los dos, y el periódico lo explica”. “Esta no es la atención básica del documento, pero es sorprendente que esta armonía pueda reconciliarse con el sistema de memoria y los modelos de grandes idiomas”.