【Maniskill】训练使用的性能指标
Eval [code]
“logger.add_scalar(f"eval/{k}”, mean, global_step)" 记录的是评估期间各个回合指标的平均值。具体记录的变量 (eval/{k}
) 包括:
eval_success_once_mean
: (如果可用) 平均回合中至少成功一次的比率 (因为是布尔值转浮点数求平均)eval_return_mean
: 平均回合累积奖励eval_episode_len_mean
: 平均回合长度eval_reward_mean
: 平均每步奖励eval_success_at_end_mean
: (如果可用且ignore_terminations=True
) 平均回合结束时成功的比率