Reinforcement Learning Toolbox
Diseño y entrenamiento de políticas con reinforcement learning
¿Tiene preguntas? Comuníquese con ventas.
¿Tiene preguntas? Comuníquese con ventas.
Reinforcement Learning Toolbox™ proporciona una app, funciones y un bloque de Simulink® para entrenar políticas usando algoritmos de reinforcement learning, tales como DQN, PPO, SAC y DDPG. Estas políticas se pueden emplear para implementar controladores y algoritmos de toma de decisiones para aplicaciones complejas, tales como asignación de recursos, robótica y sistemas autónomos.
Esta toolbox permite representar políticas y funciones de valores usando redes neuronales profundas o tablas de búsqueda, y entrenarlas a través de interacciones con entornos modelados en MATLAB® o Simulink. Puede evaluar los algoritmos de reinforcement learning monoagente o multiagente proporcionados en la toolbox o desarrollar los suyos propios. Puede experimentar con configuraciones de hiperparámetros, supervisar el progreso del entrenamiento y simular agentes entrenados de forma interactiva a través de la app o de forma programática. Para mejorar el rendimiento del entrenamiento, es posible ejecutar simulaciones en paralelo en varias CPU, GPU, clusters y en la nube (con Parallel Computing Toolbox™ y MATLAB Parallel Server™).
El formato ONNX™ permite importar políticas existentes a partir de marcos de Deep Learning como TensorFlow™ Keras y PyTorch (con Deep Learning Toolbox™). Puede generar código C, C++ y CUDA® optimizado para desplegar las políticas entrenadas en microcontroladores y GPU. Los ejemplos de referencia de esta toolbox le ayudarán a iniciar sus proyectos.
Cree agentes con Deep Q-Network (DQN), Deep Deterministic Policy Gradient (DDPG), Proximal Policy Optimization (PPO) y otros algoritmos integrados. Utilice plantillas para desarrollar agentes personalizados para entrenar políticas.
Diseñe, entrene y simule interactivamente agentes de reinforcement learning. Exporte agentes entrenados a MATLAB para su posterior uso y despliegue.
Para sistemas complejos con grandes espacios de estado-acción, defina políticas de redes neuronales profundas de forma programática, con capas de Deep Learning Toolbox, o de forma interactiva con Deep Network Designer. Si lo prefiere, puede utilizar la arquitectura de red predeterminada sugerida por la toolbox. Inicialice la política utilizando el aprendizaje por imitación para acelerar el entrenamiento. Importe y exporte modelos ONNX para permitir la interoperabilidad con otros marcos de Deep Learning.
Cree y entrene agentes de reinforcement learning en Simulink con el bloque RL Agent. Entrene varios agentes simultáneamente (reinforcement learning multiagente) en Simulink utilizando varias instancias del bloque RL Agent.
Utilice Simulink y Simscape™ para crear un modelo de un entorno. Especifique las señales de observación, acción y recompensa en el modelo.
Utilice funciones y clases de MATLAB para modelar un entorno. Especifique las variables de observación, acción y recompensa en el archivo de MATLAB.
Para acelerar el entrenamiento, ejecute simulaciones paralelas en equipos multinúcleo, recursos en la nube o clusters de cálculo usando Parallel Computing Toolbox y MATLAB Parallel Server.
Acelere el entrenamiento y la inferencia de redes neuronales profundas con las GPU NVIDIA® de alto rendimiento. Puede utilizar MATLAB con Parallel Computing Toolbox y la mayoría de las GPU NVIDIA habilitadas para CUDA con una capacidad de cálculo 3.0 o superior.
Utilice GPU Coder™ para generar código CUDA optimizado a partir de código de MATLAB que represente redes entrenadas. Genere código C/C++ con MATLAB Coder™ para desplegar políticas.
Utilice MATLAB Compiler™ y MATLAB Compiler SDK™ para desplegar políticas entrenadas como aplicaciones independientes, librerías C/C++ compartidas, ensamblados Microsoft® .NET, clases de Java® y paquetes de Python®.
Descubra cómo desarrollar políticas de reinforcement learning para problemas tales como invertir un péndulo simple, navegar en un entorno de grid-world, equilibrar un péndulo invertido, y resolver procesos de decisión genéricos de Markov.
Diseñe políticas de reinforcement learning para aplicaciones de conducción autónoma, tales como control de crucero adaptativo, asistencia de mantenimiento de carril y estacionamiento automático.
Diseñe políticas de reinforcement learning para aplicaciones de robótica.
Diseñe políticas de reinforcement learning para aplicaciones de ajuste, calibración y planificación.
Aprenda más sobre reinforcement learning con esta serie de vídeos.