Un estudio dice que algunos de los últimos sistemas de IA del mundo luchan por contar el tiempo sobre la piedad y el trabajo en las fechas.

Los investigadores dicen que aunque los modelos de IA pueden realizar tareas complejas como escribir artículos y producir arte, todavía tienen que dominar algunas habilidades que los humanos realizan fácilmente.

Un equipo de la Universidad de Edimburgo ha demostrado que el último modelo de IA no puede reproducir las posiciones de las posiciones del reloj o corregir preguntas sobre las fechas relacionadas con los calendarios.

El equipo dice que, a diferencia del mero reconocimiento de formas, relojes analógicos y calendarios para combinar la conciencia local, el contexto y las matemáticas básicas.

Los investigadores dicen que controlar esto puede dar al sistema AI la fortaleza de las aplicaciones que requieren tiempo, como asistentes de programación, robots autónomos y personas con herramientas de discapacidad visual.

El equipo experimentó que si el sistema de IA que actúa en texto e imágenes, que se conoce como Modelo de Lengua Grandeo Multi-Moodle (MLLM), puede responder preguntas relacionadas con el tiempo mirando el capó o el calendario.

Los investigadores experimentaron varios diseños de reloj, incluidos algunos dígitos romanos, con otras manos y sin él, y diferentes diales de color.

Sus resultados mostraron que el sistema AI mejor, las posiciones del reloj del reloj obtuvieron menos de una cuarta parte. Los errores eran más comunes cuando los relojes estaban en manos de números romanos o reloj estilizado. El equipo dice que cuando se retiró la segunda mano, el sistema AI no funcionó mejor que eso, lo que demuestra que hay problemas profundos con la detección de la mano y la interpretación del ángulo.

Los investigadores pidieron a los modelos de IA que respondieran una serie de preguntas basadas en el calendario, como identificar las vacaciones y trabajar en fechas pasadas y futuras. El equipo descubrió que incluso el modelo AI de mejor rendimiento es una quinta parte del cálculo de la historia del tiempo equivocado.

Estos resultados se informan en un artículo de revisión por pares que se presentará en la Decimocción Internacional de la Conferencia Internacional (ICLR) en Singapur (ICLR) el 28 de abril de 2025, con motivo de argumentos y planificación de un gran taller de modelos de idiomas en Singapur (ICLR).

یونیورسٹی آف ایڈننرا کے اسکول آف انفارمیٹکس کے روہós سکسینا ، جنہوں نے اس adie کی قی کی ے ق ق ے ے ے ے ے ے. ے ہیں اور کیلنڈر اologidamente گر کرتی ہیں۔ ہیں۔ اے آئی سlado کو وق emp Si están integrados, estas deficiencias deben abordarse.

Erio Jema, también de la Escuela de Informática, dijo: “La investigación de AI a menudo enfatiza argumentos complejos hoy, pero irónicamente, cuando muchos sistemas todavía hablan de tareas simples y cotidianas, nos esforzamos. Puedo quedar atrapado.

Source link