计算当前关节位置与目标关节位置之间差异的奖励值。差异越小,奖励越大
当机器人迈步时(摆动相),要将脚抬起到一个合适的高度。如果没有这个奖励,机器人可能会出现"拖着脚走"的情况,抬脚太高,浪费能量。
足部接触是否与预期的步态相位相匹配来基于奖励,引导机器人按照预定的步态模式正确地交替抬起和放下足部,从而实现稳定的行走。
鼓励机器人迈出更大的步子,通过奖励足部在空中停留的时间来实现。鼓励机器人进行动态行走,跑步动作。
通过奖励,防止机器人在行走时脚打滑
当双脚(左右)距离过近或过远时进行惩罚。防止左右两脚靠得太近(可能导致碰撞或不稳定),防止左右两脚分得太开(可能导致机器人失去平衡)。
两膝盖之间距离进行奖励。避免膝盖碰撞,防止步态过于夸张
保持接触力在指定范围内的奖励。对足部过大的接触力进行惩罚。防止机器人对地面施加过大的力,鼓励更平稳的步态。
x,y方向的实际运动速度尽可能接近目标速度,对其进行奖励
实际角速度和目标角速度之间的匹配程度进行奖励。误差越小获得的奖励越高
对机器人的运动速度和角速度的稳定性进行奖励
保持基座平坦方向的奖励值,鼓励机器人保持其基座(躯干)处于水平状态
对偏离目标基座高度的情况进行惩罚。鼓励机器人保持一个合适的基座高度。该奖励是基于机器人基座与其支撑脚(与地面接触的脚)平均高度之间的高度差来计算的。
对机器人基座的加速度进行惩罚,以鼓励更平滑的运动。进行平滑运动,避免剧烈的加速或减速。
鼓励机器人动作的平滑性,通过惩罚连续动作之间的大幅变化。 这对于实现流畅的运动和减少机械应力很重要。
对机器人关节使用大扭矩进行惩罚。通过最小化电机所需施加的力来鼓励高效运动。
对机器人的自由度(DOF)的高速运动进行惩罚。这样可以鼓励更平滑和可控的运动。
对机器人自由度(DOF)的加速度大的进行惩罚。这对于确保平滑和稳定的运动很重要,可以减少机器人机械部件的磨损。
对机器人与环境的碰撞进行惩罚,特别关注选定的身体部位。这鼓励机器人避免与物体或表面发生不必要的接触。