Reinforcement learning and Paralle computation

3 visualizaciones (últimos 30 días)

Mostrar comentarios más antiguos

ryunosuke tazawa el 13 de Abr. de 2022

0
Enlazar

Enlace directo a esta pregunta

https://es.mathworks.com/matlabcentral/answers/1695425-reinforcement-learning-and-paralle-computation

Comentada: Takeshi Takahashi el 18 de Abr. de 2022

Abrir en MATLAB Online

I am condcting reinforcement learning with Sac agent.

I tried to use GPU and Parallel computation, but in case of using paralle computaion, the training result changed.

At all, learning is much worse than without parallel processing.　

Do you know what caused it?

%% AGENT　setting
agentOptions = rlSACAgentOptions;
agentOptions.SampleTime = Ts;
agentOptions.DiscountFactor = 0.90;                       
agentOptions.TargetSmoothFactor = 1e-3;                   
agentOptions.ExperienceBufferLength = 500;                
agentOptions.MiniBatchSize = 256;                          
agentOptions.EntropyWeightOptions.TargetEntropy = -2;     
agentOptions.NumStepsToLookAhead  = 1;
agentOptions.ResetExperienceBufferBeforeTraining = false;
agent = rlSACAgent(actor,[critic1 critic2],agentOptions);
 
 
%% Learning setting
maxepisodes = 10000;                             
maxsteps = 1e6;                                  
trainingOptions = rlTrainingOptions(...
    'MaxEpisodes',maxepisodes,...
    'MaxStepsPerEpisode',maxsteps,...
    'StopOnError','on',...
    'Verbose',true,...
    'Plots','training-progress',...
    'StopTrainingCriteria','AverageReward',...
    'StopTrainingValue',Inf,...
    'ScoreAveragingWindowLength',10); 
trainingOptions.UseParallel = true;
trainingOptions.ParallelizationOptions.Mode = 'async';
trainingOptions.ParallelizationOptions.StepsUntilDataIsSent  = 32;
trainingOptions.ParallelizationOptions.DataToSendFromWorkers =  'Experiences';

1 comentario
Mostrar -1 comentarios más antiguosOcultar -1 comentarios más antiguos

Takeshi Takahashi el 18 de Abr. de 2022

agentOptions.ExperienceBufferLength seems too short, which may indirectly affect the parallel training. Can you increase ExperienceBufferLength to 1e6 or more?

Iniciar sesión para comentar.

Iniciar sesión para responder a esta pregunta.

Respuestas (0)

Iniciar sesión para responder a esta pregunta.

Categorías

AI, Data Science, and Statistics Deep Learning Toolbox Applications Autonomous and Control Systems Reinforcement Learning

Más información sobre Reinforcement Learning en Help Center y File Exchange.

Community Treasure Hunt

Find the treasures in MATLAB Central and discover how the community can help you!

Start Hunting!

Translated by

Reinforcement learning and Paralle computation

1 comentario
Mostrar -1 comentarios más antiguosOcultar -1 comentarios más antiguos

Respuestas (0)

Ver también

Categorías

Etiquetas

Community Treasure Hunt

Reinforcement learning and Paralle computation

1 comentario Mostrar -1 comentarios más antiguosOcultar -1 comentarios más antiguos

Respuestas (0)

Ver también

Categorías

Etiquetas

Community Treasure Hunt

1 comentario
Mostrar -1 comentarios más antiguosOcultar -1 comentarios más antiguos