Los profesionales médicos han estado utilizando inteligencia artificial (IA) para suavizar el diagnóstico durante décadas, llamado Sistema de Apoyo a la Decisión de Diagnóstico (DDSS). Los informáticos científicos del Hospital General de Massachusetts (MGH), miembro fundador del Sistema de Salud General de Mass Bergham desarrollaron su propio DDS llamado DXPLIN en 1984, que depende de miles de enfermedades, resultados clínicos y puntos de datos para producir el uso de médicos. Con la popularidad y el acceso creciente a la IA generativa y al modelo de lenguaje principal (LLMS) en medicina, los investigadores del Laboratorio de Ciencias de la Computación (LCS) de MGH intentaron comparar las habilidades de diagnóstico de D Explin, que se ha desarrollado a partir del popular LLM en las últimas cuatro décadas.
Su nueva investigación compara Chattgot, Gemini y D Explin al momento del diagnóstico de los casos de los pacientes, lo que revela que el plano DX funcionó algo mejor, pero LLM también funcionó bien. Los investigadores han imaginado conectar DXPLIN con LLM, ya que mejoraría ambos sistemas y aumentaría su utilidad médica. Los resultados se publican en La red abierta.
Edward Hoffer, co -autor de LCS MD en MGH, dijo: “Entre todo interés en modelos de idiomas grandes, es fácil olvidar que el primer sistema de IA era un sistema especializado como DXPLIN, el primer sistema de IA utilizado en medicina”.
“Estos sistemas pueden promover y expandir el diagnóstico de los médicos, recordando la información que los médicos pueden olvidarse del calor del momento y no están sesgados en las fallas comunes en el razonamiento humano. Y ahora, creemos que el MGGL los sistemas de diagnóstico existentes con una mejor capacidad de diagnóstico para mejorar su capacidad para mejorar su capacidad para mejorar la capacidad de mejorar el accidente cerebrovascular, el Stroke Decisive y el paciente es el paciente.
Los investigadores experimentaron capacidades de diagnóstico DXPLIN, CHAT GPT y Gemini utilizando 36 pacientes que se propagan en la categoría étnica, étnica, de edad y de género. En cada caso, el sistema tuvo la oportunidad de sugerir un posible diagnóstico de casos con datos de laboratorio y sin él. Con los datos de laboratorio, los tres sistemas se agregaron principalmente a la lista de diagnóstico correcta: 72 % para DXPlain, 64 % para Chat GPT y 58 % para Gemini. Sin datos de laboratorio, DXPlain ingresó el diagnóstico correcto de 56 %de tiempo, Chat GPT (42 %) y Gemini (39 %) mejoraron mejor, aunque los resultados no fueron importantes en términos de estadísticas.
Los investigadores observan que DDSS y LLM han envuelto algunas enfermedades que otros han exento, sugieren que la visión puede ser prometida. La construcción del trabajo inicial a partir de estos resultados muestra que LLM puede usarse para extraer resultados clínicos del texto narrativo, que luego se puede conectar al DDSS, lo que resulta en armonía mejora tanto los sistemas como sus resultados de diagnóstico.