Skip to content

Latest commit

 

History

History
87 lines (44 loc) · 3.06 KB

reward.md

File metadata and controls

87 lines (44 loc) · 3.06 KB

humanoid gym 奖励

1.reference motion tracking

joint_pos

​ 计算当前关节位置与目标关节位置之间差异的奖励值。差异越小,奖励越大

feet_clearance

​ 当机器人迈步时(摆动相),要将脚抬起到一个合适的高度。如果没有这个奖励,机器人可能会出现"拖着脚走"的情况,抬脚太高,浪费能量。

feet_contact_number

足部接触是否与预期的步态相位相匹配来基于奖励,引导机器人按照预定的步态模式正确地交替抬起和放下足部,从而实现稳定的行走。

2.gait

feet_air_time

​ 鼓励机器人迈出更大的步子,通过奖励足部在空中停留的时间来实现。鼓励机器人进行动态行走,跑步动作。

foot_slip

​ 通过奖励,防止机器人在行走时脚打滑

feet_distance

​ 当双脚(左右)距离过近或过远时进行惩罚。防止左右两脚靠得太近(可能导致碰撞或不稳定),防止左右两脚分得太开(可能导致机器人失去平衡)。

knee_distance

两膝盖之间距离进行奖励。避免膝盖碰撞,防止步态过于夸张

3.contact

feet_contact_forces

​ 保持接触力在指定范围内的奖励。对足部过大的接触力进行惩罚。防止机器人对地面施加过大的力,鼓励更平稳的步态。

4.vel tracking

tracking_lin_vel

​ x,y方向的实际运动速度尽可能接近目标速度,对其进行奖励

tracking_ang_vel

实际角速度目标角速度之间的匹配程度进行奖励。误差越小获得的奖励越高

vel_mismatch_exp

​ 对机器人的运动速度和角速度的稳定性进行奖励

orientation

​ 保持基座平坦方向的奖励值,鼓励机器人保持其基座(躯干)处于水平状态

base_height

​ 对偏离目标基座高度的情况进行惩罚。鼓励机器人保持一个合适的基座高度。该奖励是基于机器人基座与其支撑脚(与地面接触的脚)平均高度之间的高度差来计算的。

base_acc

对机器人基座的加速度进行惩罚,以鼓励更平滑的运动。进行平滑运动,避免剧烈的加速或减速。

5.energy

action_smoothness

​ 鼓励机器人动作的平滑性,通过惩罚连续动作之间的大幅变化。 这对于实现流畅的运动和减少机械应力很重要。

torques

​ 对机器人关节使用大扭矩进行惩罚。通过最小化电机所需施加的力来鼓励高效运动。

dof_vel

​ 对机器人的自由度(DOF)的高速运动进行惩罚。这样可以鼓励更平滑和可控的运动。

dof_acc

​ 对机器人自由度(DOF)的加速度大的进行惩罚。这对于确保平滑和稳定的运动很重要,可以减少机器人机械部件的磨损。

collision

​ 对机器人与环境的碰撞进行惩罚,特别关注选定的身体部位。这鼓励机器人避免与物体或表面发生不必要的接触。