Home Smartwatch Hacer que los modelos de IA sean más confiables para la configuración...

Hacer que los modelos de IA sean más confiables para la configuración de flujo alto

126
0

En las imágenes médicas, la ambigüedad puede presentar un gran desafío para los médicos que intentan identificar la enfermedad. Por ejemplo, en la lista x del cofre, el flujo de los pulmones, una construcción inusual de líquido en los pulmones, puede parecerse a la infiltración pulmonar, que es pus o recolección de sangre.

Un modelo de inteligencia artificial puede ayudar al médico en el análisis X -Ray identificando los detalles sutiles y aumentando el proceso de diagnóstico. Pero dado que muchas condiciones potenciales pueden estar presentes en el mismo ícono, los terapeutas probablemente querrían considerar un conjunto de posibilidades, en lugar de solo una IA predijo.

Una promesa de desarrollar una combinación de posibilidades, llamada clasificación conforme, es fácil porque se puede implementar fácilmente en la parte superior del modelo de aprendizaje automático actual. Sin embargo, puede crear un conjunto que no sea prácticamente grande.

Los investigadores del MIT ahora han desarrollado una mejora simple y efectiva que puede reducir el tamaño de las predicciones hasta en un 30 %, mientras que los pronósticos también pueden hacerlo más confiable.

Colocar un pequeño pronóstico puede ayudar a un médico de manera más efectiva a cero en el diagnóstico correcto, lo que puede mejorar y suavizar a los pacientes. Este método puede ser útil en una variedad de tareas de calificación, por ejemplo, para indicar la especie de un animal en una imagen del parque de vida silvestre, porque proporciona un conjunto de opciones pequeños pero más precisos.

“Para considerar menos clases, los conjuntos de predicciones son naturalmente más informativos que está eligiendo entre las opciones más bajas. En cierto sentido, realmente no está sacrificando nada en términos de la precisión de algo que es más informativo”.

Shanmagam ha sido agregado en papel a través de Helen Lou ’24. Swami Sancarnanin, una antigua postal del MIT, que ahora es científica de investigación en Lilia Biovasins. Y John Guttag, autor senior del MIT, Ingeniería de Ciencia e Eléctrica, Profesor de Ingeniería de la Computación e Eléctrica y Laboratorio de Informática e Inteligencia Artificial (CSAIL). La investigación se presentará en junio en una conferencia sobre visión por computadora e identificación de patrones.

La predicción está garantizada

Los asistentes de AII implementados para tareas de alto estacionamiento, como la clasificación de enfermedades en imágenes médicas, generalmente están diseñados para producir puntajes potenciales con cada pronóstico para evaluar la confianza del modelo de usuario. Por ejemplo, un modelo puede predecir que existe una posibilidad del 20 % de que una imagen sea equivalente a un diagnóstico particular, como Plyoric.

Pero es difícil confiar en la confianza predicha de un modelo porque hace mucho tiempo la investigación ha demostrado que estas posibilidades pueden ser incorrectas. Con la calificación sincronizada, la predicción del modelo se reemplaza por un conjunto de diagnóstico extremadamente posible con su garantía que está en algún lugar del conjunto de diagnóstico correcto.

Pero la incertidumbre hereditaria en las predicciones de IA a menudo causa los conjuntos de resultados del modelo que son muy útiles para ser útiles.

Por ejemplo, si un modelo está clasificando a un animal como una de las 10,000 especies potenciales en una imagen, puede producir un conjunto de 200 predicciones para que pueda ofrecer una garantía sólida.

“Para alguien, para descubrir cuál es la clase correcta, estas son muchas clases”, dice Shanmagam.

Las técnicas también pueden ser increíbles porque los pequeños cambios en las entradas, como girar ligeramente una imagen, pueden obtener conjuntos de predicciones completamente diferentes.

Para hacer que la calificación conforme sea más útil, los investigadores aplicaron una técnica diseñada para mejorar la precisión de los modelos de visión por computadora, llamado Tiempo de prueba (TTA).

TTA produce una serie de adiciones al mismo ícono, tal vez cultivando la imagen, girándola, zoom. Luego aplica el modelo de visión por computadora en cada versión del mismo icono y recopila sus predicciones.

“De esta manera, obtienes numerosas predicciones del mismo ejemplo. Por lo tanto, las predicciones generales mejoran las predicciones en términos de precisión y fuerza”, dijo Shanmagam.

Precisión máxima

Para implementar TTA, los investigadores tienen la implementación de calificación. Algunas etiquetas utilizadas para el proceso contienen los datos de la imagen. Aprenden a recopilar la adición de estos datos ayudados, y aumentan automáticamente las imágenes de tal manera que las predicciones básicas del modelo se maximicen.

Luego ejecutan una calificación constructiva sobre las nuevas predicciones de cambio de TTA. La calificación conforme ofrece un pequeño conjunto de predicciones potenciales para garantizar la misma confianza.

“Es fácil conectar el tiempo de prueba con predicciones controvertidas, prácticamente eficientes, y no requiere el entrenamiento del modelo”, dice Shanmagam.

En comparación con el trabajo anterior en la controvertida predicción en los puntos de referencia de calificación de imagen múltiple estándar, según su TTA, el procedimiento redujo el tamaño de la predicción en un 10 a 30 por ciento.

Lo importante es que las predicciones técnicas logran esta reducción en el tamaño, al tiempo que mantienen la posibilidad de garantía.

Los investigadores también encontraron que, aunque están sacrificando algunos datos etiquetados que se utilizarán comúnmente para el método de adaptación de clasificación, el TTA aumenta la precisión más que el costo de perder estos datos.

“Plantea preguntas interesantes sobre cómo utilizamos los datos etiquetados después del entrenamiento del modelo”, dice Shanmagam. La asignación de datos entre varios pasos posteriores al entrenamiento es una dirección importante para futuras tareas. “

En el futuro, los investigadores quieren corregir la efectividad de un punto de vista en el contexto de los modelos que clasifican el texto en lugar de las imágenes. Para mejorar aún más el trabajo, los investigadores también están considerando formas de reducir la cantidad de cálculos necesarios para TTA.

Esta investigación, en parte, ha sido proporcionada por Wistom Corporation.

Source link