Los investigadores de la EPFL han publicado un marco programable que supera un importante cuello de botella computacional de los sistemas de inteligencia artificial basados en óptica. En una serie de experimentos de clasificación de imágenes, utilizaron luz dispersada por un láser de baja potencia para realizar cálculos precisos y escalables utilizando una fracción de la energía de la electrónica.
A medida que los sistemas digitales de inteligencia artificial crecen en tamaño e impacto, también aumenta la energía necesaria para entrenarlos y desplegarlos, sin mencionar las emisiones de carbono asociadas. Investigaciones recientes sugieren que si la producción actual de servidores de IA continúa al ritmo actual, su consumo anual de energía podría superar el de un país pequeño para 2027. Redes neuronales profundas inspiradas en la arquitectura del cerebro humano, particularmente hambrientas de poder. Millones o miles de millones de conexiones entre múltiples capas de procesadores similares a neuronas.
Para hacer frente a esta creciente demanda de energía, los investigadores han redoblado los esfuerzos para implementar sistemas de computación óptica, que existen de forma experimental desde los años 1980. Estos sistemas dependen de fotones para procesar datos y, aunque en teoría la luz se puede utilizar para realizar cálculos de manera más rápida y eficiente que los electrones, los sistemas ópticos presentan un desafío importante que ha inhibido su capacidad para superar el estado del arte electrónico.
“Para clasificar los datos en una red neuronal, cada nodo o ‘neurona’ debe tomar una ‘decisión’ de activarse o no en función de los datos de entrada ponderados. Esta decisión se denomina transformación no lineal de los datos. no es directamente proporcional a la entrada”, afirma Christoph Moser, director del Laboratorio de Dispositivos de Fotónica Aplicada de la Escuela de Ingeniería de la EPFL.
Moser explica que, si bien las redes neuronales digitales pueden realizar fácilmente transformaciones no lineales con transistores, en los sistemas ópticos este paso requiere láseres muy potentes. Moser trabajó con los estudiantes Mustafa Yıldırım, Niazi Alas Dunk y Elker Öğz, así como con Demitri Psaltis, jefe del laboratorio de óptica, para desarrollar una forma energéticamente eficiente de realizar ópticamente estos cálculos no lineales. Su nuevo enfoque implica codificar datos como píxeles en una imagen, en la modulación espacial de un rayo láser de baja potencia. El haz se refleja sobre sí mismo muchas veces, provocando una multiplicación no lineal de píxeles.
“Nuestros experimentos de clasificación de imágenes en tres conjuntos de datos diferentes muestran que nuestro método es escalable y hasta 1.000 veces más potente que las redes digitales profundas de última generación, lo que la convierte en una red neuronal óptica que crea una plataforma prometedora”, afirma. Saltis.
La investigación, financiada con una subvención Sinergia de la Fundación Nacional Suiza para la Ciencia, se publicó recientemente. Fotónica de la naturaleza.
Una solución estructural sencilla
En la naturaleza, los fotones no interactúan directamente entre sí como lo hacen los electrones cargados. Por lo tanto, para lograr transiciones no lineales en los sistemas ópticos, los científicos tuvieron que “forzar” a los fotones a interactuar indirectamente, por ejemplo cambiando las propiedades ópticas del vidrio u otros materiales que lo atraviesan utilizando suficiente luz para.
Los científicos solucionaron la necesidad de un láser de alta potencia con una solución bastante simple: codificaron los píxeles de una imagen en la superficie de un rayo láser de baja potencia. Al realizar esta codificación dos veces, los píxeles se multiplican por sí mismos, es decir, se elevan al cuadrado, ajustando la velocidad del haz en el codificador. Dado que elevar al cuadrado es una transformación no lineal, esta modificación estructural captura la no linealidad necesaria para los cálculos de redes neuronales, a una fracción del costo de energía. Esta codificación se puede realizar dos, tres o incluso diez veces, aumentando la no linealidad de la transformación y la precisión del cálculo.
“Calculamos que, utilizando nuestro sistema, la energía necesaria para contar ópticamente el multiplicador es ocho órdenes de magnitud menor que la necesaria para un sistema electrónico”, afirma Psaltis.
Moser y Psaltis enfatizan que la escalabilidad de su enfoque de baja energía es una gran ventaja, ya que el objetivo final será utilizar sistemas híbridos electrónico-ópticos para reducir el consumo de energía de las redes neuronales digitales. Sin embargo, se necesita más investigación de ingeniería para lograr tal escala. Por ejemplo, dado que los sistemas ópticos utilizan hardware diferente al de los sistemas electrónicos, el siguiente paso en el que los investigadores ya están trabajando es desarrollar un compilador para traducir datos digitales en códigos que los sistemas ópticos puedan utilizar.