Home Smartwatch Un experimento cerebral clásico reveló la mayor debilidad de la IA

Un experimento cerebral clásico reveló la mayor debilidad de la IA

19

Los sistemas de inteligencia artificial pueden escribir ensayos, responder preguntas y resolver problemas complejos. Pero una nueva investigación sugiere que pueden tener dificultades con algo que hacen todos los días: concentrarse en la tarea que tienen entre manos cuando están distraídos.

Los investigadores dirigidos por Suketu Patel sometieron varios modelos líderes de IA a una conocida prueba psicológica llamada tarea de Stroop. Los resultados revelan una diferencia significativa entre cómo los sistemas de IA procesan la información y cómo el cerebro humano gestiona la atención.

¿Cuál es la tarea de Stroop?

La tarea de Stroop es un test psicológico clásico que se utiliza desde hace décadas para estudiar la atención, la concentración y el autocontrol.

En la prueba, palabras de colores como “rojo”, “azul” o “verde” aparecen con tinta de color. A veces las palabras y los colores de la tinta coinciden. Por ejemplo, la palabra “rojo” puede aparecer en tinta roja. Otras veces entran en conflicto, como la palabra “rojo” impresa en tinta azul.

Se pide a los participantes que nombren el color de la tinta en lugar de leer la palabra.

Suena simple, pero plantea un desafío porque leer palabras es un hábito automático para la mayoría de las personas. El cerebro debe suprimir la necesidad de leer la palabra y centrarse en identificar el color de la tinta.

Los psicólogos suelen utilizar la tarea para medir lo que se conoce como control ejecutivo, un conjunto de procesos mentales que ayudan a las personas a controlar la atención, resistir las distracciones y centrarse en las metas.

Probando el enfoque de la IA

Los investigadores querían ver si los modelos modernos de lenguajes grandes (LLM) manejaban este desafío tan bien como los humanos.

LLM es el sistema de inteligencia artificial detrás de herramientas como ChatGPT, Claude y Gemini. Están entrenados en grandes cantidades de texto y aprenden patrones de lenguaje, lo que les permite producir respuestas que a menudo parecen notablemente humanas.

Cuando se les dan listas cortas de palabras de cinco colores, los sistemas de inteligencia artificial generalmente funcionan bien, incluso cuando las palabras y los colores no coinciden.

Pero el panorama ha cambiado drásticamente a medida que la lista se hace más larga.

GPT-4o logró un 91% de precisión al tratar con cinco palabras. Con diez palabras, su precisión cayó al 57%. Cuando la lista se amplió a cuarenta palabras, la precisión se redujo a sólo el 15%.

El Cloud 3.5 Sonnet mantuvo un rendimiento estable en la lista de veinte palabras, pero luego experimentó una fuerte caída, cayendo al 24% de precisión en la lista de cuarenta palabras.

Los investigadores observaron patrones similares en GPT-5, Claude Opus 4.1 y Gemini 2.5.

Cuando la IA pierde el foco

El desafío se volvió más difícil cuando las palabras de colores que coincidían y no coincidían aparecían juntas en la misma lista.

En esta situación, el rendimiento empeora. La precisión de los elementos no coincidentes se redujo a casi cero en algunos casos.

Según los investigadores, el modelo de IA tuvo problemas para seguir las instrucciones para reconocer el color de la tinta. En cambio, cada vez más optaban por leer las palabras ellos mismos.

En otras palabras, los sistemas parecían incapaces de suprimir consistentemente las respuestas para las que estaban mejor entrenados.

Este hallazgo es particularmente interesante porque los humanos enfrentan conflictos similares. En general, las personas son mucho mejores leyendo palabras que nombrando colores de tinta. Sin embargo, a pesar de este sesgo, la mayoría de las personas pueden mantener una alta precisión y un rendimiento estable incluso cuando se enfrentan a largas listas de sonidos y colores conflictivos.

Atención humana versus atención de la máquina

La investigación destaca una diferencia importante entre la inteligencia humana y la artificial.

Aunque los sistemas modernos de IA pueden producir capacidades de lenguaje y razonamiento impresionantes, sus procesos subyacentes difieren de los procesos de atención que se encuentran en los cerebros biológicos.

Las personas a menudo pueden mantenerse enfocadas en un objetivo específico mientras filtran información competitiva. Los resultados sugieren que los modelos actuales de IA pueden tener dificultades con este tipo de control cognitivo cuando las tareas se vuelven cada vez más exigentes.

Los investigadores sostienen que la disminución del rendimiento observada en estos experimentos apunta a limitaciones fundamentales de los grandes modelos de lenguaje actuales. Si bien la IA a veces puede imitar el comportamiento humano, su capacidad para mantener la atención parece funcionar de manera muy diferente a los métodos humanos.

Los hallazgos nos recuerdan que incluso los sistemas de inteligencia artificial más avanzados todavía tienen debilidades, especialmente cuando las tareas requieren que resistan la distracción y se concentren en secuencias extensas de información.

Enlace fuente