Home Smartwatch La IA puede descubrir rápidamente nueva física, pero tiene un problema sorprendente

La IA puede descubrir rápidamente nueva física, pero tiene un problema sorprendente

23

La inteligencia artificial ya está desempeñando un papel importante al ayudar a los cosmólogos a estudiar el universo. Ahora, una nueva investigación sugiere que una técnica de aprendizaje automático llamada aprendizaje por transferencia podría hacer que la búsqueda de nueva física sea mucho más rápida y menos costosa. Sin embargo, la investigación también descubrió un inconveniente sorprendente: la IA a veces puede ser tan dependiente de lo que ya ha aprendido que le cuesta reconocer algo realmente nuevo.

Investigación, publicada Revista de cosmología y física de astropartículas (JCAP), examinan cómo el aprendizaje por transferencia puede ayudar a los investigadores a investigar teorías que van más allá del modelo cosmológico estándar.

La IA y el descubrimiento de una nueva física

El actual modelo estándar de cosmología, conocido como ΛCDM, explica con éxito muchas propiedades a gran escala del Universo, incluidas su expansión y la distribución de las galaxias. Sin embargo, los científicos creen que el modelo no es la respuesta definitiva.

Observaciones recientes han planteado preguntas que podrían conducir a una nueva física, incluidos neutrinos masivos, gravedad alterada y los efectos de la evolución de la energía oscura. Explorar estas posibilidades requiere que los investigadores creen una gran cantidad de simulaciones por computadora detalladas, cada una de las cuales representa un universo virtual construido utilizando diferentes suposiciones físicas.

La creación de estas simulaciones es costosa desde el punto de vista computacional y, a menudo, exige una potencia informática considerable.

Uso del aprendizaje por transferencia para reducir los costos de simulación

Los investigadores han investigado si el aprendizaje por transferencia puede hacer que este proceso sea más eficiente.

El aprendizaje por transferencia permite que un sistema de inteligencia artificial aplique el conocimiento adquirido en una tarea a otra tarea relacionada. En lugar de entrenar completamente una red neuronal en las simulaciones más complejas y costosas desde el punto de vista computacional, el equipo primero la entrenó en simulaciones más simples basadas en ΛCDM. A esta fase inicial, conocida como preentrenamiento, le siguió un entrenamiento adicional utilizando modelos más sofisticados que potencialmente incluían nueva física.

“Es básicamente un atajo”, explica el coautor del estudio Adrian Baer, ​​cosmólogo del Instituto Flatiron y la Universidad de Princeton. “Por lo general, la gente entrena la IA directamente en las simulaciones computacionalmente más costosas. Lo que hacemos en cambio es usar primero simulaciones ΛCDM más simples y menos costosas para darle a la IA una idea de lo que está sucediendo, y luego pasar a modelos más complejos”.

Bayer compara los métodos de aprendizaje con los de los libros de texto.

“Primero se lee un libro básico para tener una idea del conocimiento”, dice Bayer, “y luego se pasa al libro realmente complejo”.

Según la primera autora Veena Krishnaraj, estudiante de posgrado de la Universidad de Princeton, esta técnica evita que la IA “digiera todo a la vez”.

Los resultados fueron interesantes. En algunos casos, el aprendizaje por transferencia reduce el número de simulaciones costosas requeridas por un factor de más de diez.

Cuando el conocimiento previo se convierte en un problema

La investigación también reveló un desafío menos obvio conocido como transferencia negativa.

Utilizando la analogía del libro de texto de Baer, ​​imaginemos aprender medicina a partir de un texto introductorio y luego encontrarnos con una enfermedad rara que se parece mucho a una afección común. El conocimiento existente suele ser útil, pero a veces puede fomentar conclusiones erróneas.

El mismo problema puede surgir en los sistemas de IA.

En algunos casos, las firmas de la nueva física son similares a patrones que la IA ya ha asociado con el modelo cosmológico estándar. Cuando esto sucede, la red previamente entrenada puede interpretar información desconocida a través de la lente de lo que ya sabe, lo que dificulta la detección de nuevos efectos verdaderos.

Los investigadores observaron este efecto al estudiar simulaciones que incluían neutrinos masivos. Algunas de las firmas observacionales asociadas con la masa de neutrinos se parecen mucho a los cambios asociados con un parámetro ΛCDM existente llamado σ8, que mide la fuerza con la que se acumula la materia en todo el universo.

Debido a esta similitud, la red neuronal previamente entrenada inicialmente tuvo dificultades para distinguir los dos efectos.

“El cambio negativo no es aleatorio. Está impulsado por la decadencia física inherente al modelo”, dice Krishnaraj.

En otras palabras, diferentes procesos físicos pueden producir firmas observables muy similares, lo que dificulta identificar con precisión qué parámetro es responsable de la IA.

“Así que es algo de lo que tenemos que ser conscientes y tratar de mitigar”, concluye.

Promesas y riesgos para la cosmología futura.

Los resultados resaltan tanto los beneficios potenciales como las limitaciones de aplicar conceptos de modelos básicos a la física. Estos métodos son muy similares a las técnicas detrás de los modernos sistemas de IA generativa y grandes modelos de lenguaje.

Como señalan los investigadores en el artículo, el entrenamiento previo puede acelerar la inferencia, “pero también puede dificultar el aprendizaje de nueva física”.

Hasta ahora, el método sólo se ha probado mediante simulaciones. El siguiente paso será aplicarlo a observaciones astronómicas reales.

El equipo cree que el aprendizaje por transferencia podría convertirse en una herramienta importante para los próximos estudios cósmicos, que se espera que recopilen una cantidad sin precedentes de información de alta precisión sobre el universo en los próximos años.

Veena Krishnaraj, Adrian E. El artículo “Transferir aprendizaje más allá del modelo estándar” de Baer, ​​​​Christian Krug Jesperson y Peter Melchior ya está disponible SER.

Enlace fuente