feat: add robosuite support for sac #20

OrangeX4 · 2024-03-22T12:28:26Z

python reproduce/sac/run_sac_online.py --config reproduce/sac/config/robosuite/Door-Panda.py

typoverflow · 2024-03-22T13:18:07Z

reproduce/sac/config/robosuite/base.py

+log_interval = 10
+warmup_epoch = 2
+random_policy_epoch = 5
+max_trajectory_length = 1000


这里的max_trajectory_length和环境的horizon都设置成500

同时环境还要添加controller=OSC_POSE，hard_reset=False这两个kwargs

typoverflow · 2024-03-22T13:20:36Z

reproduce/sac/run_sac_online.py

这里的train loop的逻辑要变更，改成：训练N1个epoch，其中每个epoch会先收集N2个episode，然后训练N3个gradient step，其中N1=2000, N2=10, N3=1000

OrangeX4 added 3 commits March 22, 2024 20:19

feat: add gym_wrapper.py

2d5232b

feat: add robosuite config

2797936

feat: support robosuite for run_sac_online.py

e83295b

typoverflow reviewed Mar 22, 2024

View reviewed changes

OrangeX4 added 2 commits March 23, 2024 00:07

update base.py

fc42bc1

create run_sac_robosuite.py

e78b543

Provide feedback