Sayak Mukherjee
Followers: 0 Following: 0
Python, MATLAB
Spoken Languages:
Bengali, English, Hindi
Estadística
8 Preguntas
0 Respuestas
CLASIFICACIÓN
32.651
of 295.569
REPUTACIÓN
1
CONTRIBUCIONES
8 Preguntas
0 Respuestas
ACEPTACIÓN DE RESPUESTAS
12.5%
VOTOS RECIBIDOS
1
CLASIFICACIÓN
of 20.247
REPUTACIÓN
N/A
EVALUACIÓN MEDIA
0.00
CONTRIBUCIONES
0 Archivos
DESCARGAS
0
ALL TIME DESCARGAS
0
CLASIFICACIÓN
of 154.105
CONTRIBUCIONES
0 Problemas
0 Soluciones
PUNTUACIÓN
0
NÚMERO DE INSIGNIAS
0
CONTRIBUCIONES
0 Publicaciones
CONTRIBUCIONES
0 Público Canales
EVALUACIÓN MEDIA
CONTRIBUCIONES
0 Temas destacados
MEDIA DE ME GUSTA
Feeds
Pregunta
Mirror symmetry in actions in reinforcement learning
I am training a RL control problem to perforem neck kinematics. I want the action space to have mirror symmetry as explained in ...
alrededor de 2 años hace | 0 respuestas | 0
0
respuestasPregunta
Control the exploration in soft actor-critic
What is the best way to control the exploration in SAC agent. For TD3 agent I used to control the exploration by adjusting the v...
más de 2 años hace | 1 respuesta | 1
1
respuestaPregunta
Reinforcement learning agent not being saved during training
I am trying to train my model using TD3 agent. During the training process I am trying to save the agent above a certain episode...
casi 3 años hace | 1 respuesta | 0
1
respuestaPregunta
Dont need to save 'savedAgentResultStruct' with RL agent
When I am saving agents during RL iterations using 'EpisodeReward' criteria, matlab is also saving 'savedAgentResultStruct' alon...
casi 4 años hace | 0 respuestas | 0
0
respuestasPregunta
Change revolute joint parameter in env.ResetFcn during reinforcement learning
What is the best way to randomize the initial revolute joint angle during eacg episode of reinforcement learning right now I am...
alrededor de 4 años hace | 0 respuestas | 0
0
respuestasPregunta
What is the best activation function to get action between 0 and 1 in DDPG network?
I am using DDPG network to run a control algorithm which has inputs (actions of RL agent, 23 in total) varying between 0 and 1. ...
alrededor de 4 años hace | 1 respuesta | 0
1
respuestaPregunta
Expected reward blows up while training (DDPG agent, reinforcement learning)
I am training a DDPG network and after training for around 5000 iterations, the model seems doesnot seem to converge while the e...
alrededor de 4 años hace | 1 respuesta | 0
1
respuestaPregunta
Use saved reinforcement learning DDPG agent
I have saved DDPG agent using the optiopn rlTrainingOptions.SaveAgentValue = 3000 During the simulations number of agents are ...
alrededor de 4 años hace | 1 respuesta | 0