Los sistemas informáticos de «aprendizaje profundo», basados en redes neuronales artificiales que imitan la forma en que el cerebro aprende por un acervo de datos, se han convertido en un tema candente en informática, debido a la aparición del procesador nanofotónico. Además de permitir tecnologías tales como software de reconocimiento de voz y facial, estos sistemas podrían recorrer vastas cantidades de datos médicos para encontrar patrones que pudieran ser útiles diagnósticamente o escanear fórmulas químicas para posibles nuevos fármacos.
Pero los cálculos que estos sistemas deben llevar a cabo son muy complejos y exigentes, incluso para las computadoras más potentes.
Ahora, un equipo de investigadores en el MIT y en otros lugares ha desarrollado un nuevo enfoque para tales cálculos, utilizando la luz en lugar de la electricidad, que dicen podría mejorar enormemente la velocidad y la eficiencia de ciertos cálculos de aprendizaje profundo. Sus resultados aparecen hoy en la revista Nature Photonics en un artículo del postdoctorado MIT Yichen Shen, el estudiante de posgrado Nicholas Harris, los profesores Marin Soljačić y Dirk Englund, y otros ocho.
Soljačić dice que muchos investigadores a lo largo de los años han hecho afirmaciones acerca de las computadoras basadas en la óptica, pero que «la gente dramáticamente prometió más de lo que podía la ciencia en aquel momento, y se salió por la tangente. Si bien muchos usos propuestos de tales computadoras fotónicas no resultó práctico, el sistema de red neural desarrollado por este equipo «puede ser adecaudo para el aprendizaje profundo de algunas aplicaciones«, dice.
Las arquitecturas de los ordenadores tradicionales no son muy eficientes cuando se trata de los tipos de cálculos necesarios para ciertas tareas importantes de redes neuronales. Tales tareas típicamente implican multiplicaciones repetidas de matrices, que pueden ser muy computacionalmente intensivas en chips convencionales de CPU o GPU.
Después de años de investigación, el equipo del MIT ha encontrado una forma de realizar estas operaciones ópticamente en su lugar. «Este chip, una vez que lo sintonice, puede llevar a cabo la multiplicación matricial con, en principio, con cero energía, casi al instante«, dice Soljačić. «Hemos demostrado los bloques de construcción cruciales, pero aún no el sistema completo».
Por analogía, Soljačić señala que incluso unas lentes de gafas ordinarias llevan a cabo un cálculo complejo (la llamada transformada de Fourier) en ondas luminosas que pasan a través de ella. La forma en que los haces de luz realizan cálculos en los nuevos chips fotónicos es mucho más general, pero tiene un principio subyacente similar. El nuevo enfoque utiliza múltiples haces de luz dirigidos de tal manera que sus ondas interactúan entre sí, produciendo patrones de interferencia que transmiten el resultado de la operación prevista. El dispositivo resultante es algo que los investigadores llaman un procesador nanofotónico programable.
El resultado, dice Shen, es que los chips ópticos que usan esta arquitectura podrían, en principio, realizar cálculos realizados en algoritmos de inteligencia artificial típicos mucho más rápido y usar menos de una milésima de energía por operación como chips electrónicos convencionales. «La ventaja natural de usar la luz para hacer la multiplicación matricial juega un papel importante en la aceleración y el ahorro de energía, debido a que las multiplicaciones de matrices densas son la parte que más energía consume y consume mucho tiempo en los algoritmos Inteligencia Artificial«, dice.
El nuevo procesador nanofotónico programable, que fue desarrollado en el laboratorio de Englund por Harris y colaboradores, utiliza una matriz de guías de onda que están interconectadas de una manera que se puede modificar según sea necesario, la programación de ese conjunto de haces para un cálculo específico. «Se puede programar en cualquier operación matricial«, dice Harris. El procesador guía la luz a través de una serie de guías de ondas fotónicas acopladas. La propuesta completa del equipo requiere capas intercaladas de dispositivos que apliquen una operación llamada función de activación no lineal, en analogía con la operación de neuronas en el cerebro.
Para demostrar el concepto, el equipo estableció el procesador nanofotónico programable para implementar una red neuronal que reconoce cuatro sonidos básicos de vocales. Incluso con este sistema rudimentario, fueron capaces de alcanzar un nivel de precisión del 77 por ciento, en comparación con aproximadamente el 90 por ciento para los sistemas convencionales. No hay «obstáculos sustanciales» a la ampliación del sistema para una mayor precisión, dice Soljačić.
Englund agrega que el procesador nanofotónico programable podría tener otras aplicaciones también, incluyendo procesamiento de la señal para la transmisión de datos. «El procesamiento de señales analógicas de alta velocidad es algo que esto podría manejar» más rápido que otros enfoques que primero convierten la señal en forma digital, ya que la luz es un medio inherentemente analógico. «Este enfoque podría realizar el procesamiento directamente en el dominio analógico», dice.
El equipo dice que todavía necesitará mucho más esfuerzo y tiempo para hacer este sistema útil; sin embargo, una vez que el sistema se amplíe y funcione plenamente, podrá encontrar muchos casos prácticos para el usuario, como centros de datos o sistemas de seguridad. El sistema también podría ser una bendición para los automóviles de conducción autónoma o los drones, dice Harris, o «siempre que usted necesite hacer un montón de operaciones, pero no dispone de mucha potencia o tiempo».