快捷方式

RewardClipping

class torchrl.envs.transforms.RewardClipping(clamp_min: Optional[float] = None, clamp_max: Optional[float] = None, in_keys: Optional[Sequence[NestedKey]] = None, out_keys: Optional[Sequence[NestedKey]] = None)[source]

將獎勵值限制在 clamp_minclamp_max 之間。

參數:
  • clip_min (scalar) – 結果獎勵值的最小值。

  • clip_max (scalar) – 結果獎勵值的最大值。

transform_reward_spec(reward_spec: TensorSpec) TensorSpec[source]

轉換獎勵規格,使結果規格符合轉換映射。

參數:

reward_spec (TensorSpec) – 轉換前的規格

返回:

轉換後預期的規格

文件

存取 PyTorch 完整的開發者文件

查看文件

教學

取得為初學者與進階開發者提供的深入教學

查看教學

資源

尋找開發資源並獲得您問題的解答

查看資源