Instituto Max Planck desarrolla un sistema de Reinforcement Learning para detectores de ondas gravitacionales

"Uno de los beneficios de MATLAB y Simulink fue realizar iteraciones rápidamente entre diferentes algoritmos de Reinforcement Learning, lo que redujo en gran medida el tiempo que llevó elegir el algoritmo ideal".

Resultados principales

  • Agente de Reinforcement Learning desarrollado con MATLAB y Simulink supera el rendimiento de seres humanos en la tarea de mejorar la sensibilidad astrofísica de las estrellas de neutrones binarias
  • Primera implementación de control MIMO basado en Reinforcement Learning para sistemas optomecánicos demostrada en un detector de ondas gravitacionales
  • Agente de Reinforcement Learning entrenado y validado en simulación antes de la implementación utilizando Simulink
Gráfico que compara el rendimiento del agente de Reinforcement Learning y aprendizaje humano. Muestra la distancia máxima observable del detector GEO600 GW de una estrella de neutrones binaria de 1,4 masas solares cada una, óptimamente orientado y ubicado.

Agente de Reinforcement Learning implementado supera el rendimiento de seres humanos en la tarea de mejorar la sensibilidad astrofísica de las estrellas de neutrones binarias. (Crédito de la imagen: arXiv)

Investigadores del Instituto Max Planck de Física Gravitacional en Hannover, Alemania, estudian diversas áreas de la física, relatividad general, óptica cuántica y astrofísica. Un proyecto en curso de notable relevancia en el instituto es la detección de ondas gravitacionales causadas por eventos astrofísicos de gran escala, como la colisión de agujeros negros, con observatorios de interferometría láser, como GEO600 en Alemania o LIGO en Estados Unidos.

Un observatorio de interferometría láser de ondas gravitacionales funciona proyectando haces láser en espejos ubicados a kilómetros de distancia para medir diminutas fluctuaciones en el espacio temporal causadas por el paso de ondas gravitacionales. Es necesario controlar estos espejos, dado que las ondas gravitacionales solo pueden ser detectadas cuando todos los demás cambios no gravitacionales en la longitud de la trayectoria (como perturbaciones sísmicas locales causadas por la actividad de olas marítimas, maquinaria agrícola, etc.) se suprimen activa o pasivamente. El control y la alineación de los cientos de espejos instalados en el observatorio se ha realizado tradicionalmente de forma manual, con ingenieros y científicos estudiando el sistema y utilizando sus conocimientos e intuición para crear y ajustar filtros de control.

Científicos del Instituto Max Planck de Física Gravitacional desarrollaron un sistema de Reinforcement Learning en MATLAB® y Simulink® para ajustar y alinear algunos de los espejos clave del observatorio automáticamente. Con Deep Learning Toolbox™, crearon una red neuronal combinada convolucional y de memoria a corto plazo, que mide desalineamientos analizando el video de cámaras colocadas en el diseño optomecánico. La salida de la red neuronal es el estado del entorno de Reinforcement Learning. Con Simulink Design Optimization™ y Reinforcement Learning Toolbox™, lograron generar automáticamente una señal de recompensa para el sistema de Reinforcement Learning basado en los principios de teoría de control clásica.

Los científicos configuraron un entorno de simulación en Simulink basado en las mediciones que habían obtenido del sistema físico utilizando System Identification Toolbox™. Utilizaron este entorno con Reinforcement Learning Toolbox para probar diferentes algoritmos y entrenar el agente de Reinforcement Learning sin necesidad de realizar cambios físicos en el equipo. El éxito con el uso de Reinforcement Learning en GEO600 representa la primera implementación de detección y control de alineación basados en redes neuronales en un detector de ondas gravitacionales.