Un equipo internacional de matemáticos dirigido por el estadístico Tahoe Kim de la Universidad de Lehigh ha desarrollado una nueva forma de hacer predicciones que se alinean más estrechamente con los resultados del mundo real. Su enfoque tiene como objetivo mejorar las predicciones en diversos campos de la ciencia, en particular la investigación en salud, la biología y las ciencias sociales.
Los investigadores llaman a su técnica Predictor lineal de acuerdo máximo, o MALP. Su objetivo central es mejorar qué tan bien los valores predichos coinciden con los observados. MALP lo hace maximizando el Coeficiente de Correlación de Concordancia o CCC. Esta medida estadística evalúa cómo los pares de números caen a lo largo de la línea de 45 grados en un diagrama de dispersión, lo que refleja tanto la precisión (qué tan estrechamente se agrupan los puntos) como la precisión (qué tan cerca están de esa línea). Los métodos tradicionales, incluido el método de mínimos cuadrados ampliamente utilizado, generalmente intentan minimizar el error medio. Aunque son efectivos en muchas situaciones, estos métodos pueden fallar cuando el objetivo principal es asegurar una fuerte alineación entre las predicciones y los valores reales, dijo Kim, profesor asistente de matemáticas.
“A veces, no sólo queremos que nuestras predicciones sean cercanas: queremos que tengan el mayor acuerdo con los valores verdaderos”, explica Kim. “La cuestión es, ¿cómo podemos definir la concordancia de dos objetos de una manera científicamente significativa? Una forma de visualizar qué tan cerca están los puntos en un diagrama de dispersión a lo largo de una línea de 45 grados entre el valor predicho y el valor real. Entonces, si el diagrama de dispersión de estos muestra una fuerte alineación, entonces podemos decir que hay una buena concordancia de 45 grados a lo largo de estas dos líneas”.
Por qué el acuerdo es más importante que la simple reciprocidad
Según Kim, la gente suele pensar primero en el coeficiente de correlación de Pearson cuando escuchan la palabra acuerdo, ya que se introdujo temprano en la educación estadística y sigue siendo una herramienta fundamental. El método de Pearson mide la fuerza de una relación lineal entre dos variables, pero no prueba específicamente si la relación se alinea con la línea de 45 grados. Por ejemplo, puede detectar fuertes correlaciones para líneas inclinadas a 50 grados o 75 grados, siempre que los puntos de datos estén más cerca de una línea recta, dijo Kim.
“En nuestro caso, estamos específicamente interesados en la alineación con una línea de 45 grados. Para esto, utilizamos una medida diferente: el coeficiente de correlación de concordancia, introducido por Lin en 1989. Esta métrica se centra específicamente en qué tan bien se alinean los datos con la línea de 45 grados. Lo que hemos creado es una predicción y una predicción esquemática para determinar el valor. El valor real”.
Prueba MALP con escaneos oculares y medidas corporales
Para evaluar qué tan bien funciona MALP, el equipo realizó experimentos utilizando datos simulados y mediciones reales, incluidos escaneos oculares y evaluaciones de grasa corporal. Un estudio aplicó MALP a los datos de un proyecto de oftalmología que comparó dos tipos de dispositivos de tomografía de coherencia óptica (OCT): el antiguo Stratus OCT y el más nuevo Cirrus OCT. A medida que los centros médicos adoptan el sistema Cyrus, los médicos necesitan una forma confiable de traducir las mediciones para poder comparar los resultados a lo largo del tiempo. Utilizando imágenes de alta calidad de 26 ojos izquierdos y 30 ojos derechos, los investigadores probaron con qué precisión MALP podía predecir lecturas de OCT de estratos a partir de mediciones de OCT serosas y compararon su rendimiento con el método de mínimos cuadrados. MALP produjo predicciones que se alinearon más estrechamente con los valores verdaderos de los estratos, mientras que los mínimos cuadrados superaron ligeramente a MALP en la minimización del error medio, destacando una compensación entre el acuerdo y la minimización del error.
El equipo también analizó un conjunto de datos de grasa corporal de 252 adultos que incluía peso, tamaño del abdomen y otras medidas corporales. Las mediciones directas del porcentaje de grasa corporal, como el pesaje bajo el agua, son confiables pero costosas, por lo que a menudo se sustituyen por mediciones más simples. Se utilizó MALP para estimar el porcentaje de grasa corporal y se evaluó con el método de mínimos cuadrados. Los resultados fueron similares al estudio de escaneo ocular: MALP proporcionó predicciones que coincidían más estrechamente con los valores reales, mientras que los mínimos cuadrados nuevamente tuvieron errores medios ligeramente más bajos. Este patrón recurrente subraya el equilibrio actual entre acuerdo y minimización de errores.
Elegir la herramienta adecuada para el trabajo adecuado
Kim y sus colegas observaron que MALP a menudo proporciona predicciones que coinciden con los datos reales de manera más efectiva que las técnicas estándar. Sin embargo, señalan que los investigadores deberían elegir entre MALP y enfoques más tradicionales en función de sus prioridades específicas. Cuando el objetivo principal es reducir el error general, los métodos establecidos siguen funcionando bien. Cuando el énfasis está en predicciones que se alinean lo más posible con los resultados reales, MALP suele ser la opción más sólida.
El impacto potencial de este trabajo alcanza muchas áreas científicas. Las herramientas de predicción avanzadas pueden beneficiar a la medicina, la salud pública, la economía y la ingeniería. Para los investigadores que dependen de pronósticos, MALP ofrece una alternativa prometedora, especialmente cuando lograr un acuerdo cercano con los resultados del mundo real es más importante que simplemente reducir la brecha media entre los valores previstos y observados.
“Necesitamos investigar más a fondo”, dijo Kim. “Actualmente, nuestra configuración está en la clase de predictores lineales. Este conjunto es lo suficientemente grande como para usarse prácticamente en muchos casos, pero aún es matemáticamente limitado. Por lo tanto, queremos extenderlo a la clase general para que nuestro objetivo sea eliminar la parte lineal y así se convierta en el predictor de máxima concordancia”.











