捷徑

BinarizeReward

class torchrl.envs.transforms.BinarizeReward(in_keys: Optional[Sequence[NestedKey]] = None, out_keys: Optional[Sequence[NestedKey]] = None)[原始碼]

如果獎勵為空值或非空值,則將獎勵映射到二進位值 (0 或 1)。

參數:
  • in_keys (List[NestedKey]) – 輸入鍵

  • out_keys (List[NestedKey], optional) – 輸出鍵。預設為 in_keys 的值。

  • dtype (torch.dtype, optional) – 二元化獎勵的 dtype。預設為 torch.int8

transform_reward_spec(reward_spec: TensorSpec) TensorSpec[原始碼]

轉換獎勵規格,使產生的規格與轉換映射匹配。

參數:

reward_spec (TensorSpec) – 轉換前的規格

傳回:

轉換後的預期規格

文件

取得 PyTorch 的全面開發人員文件

檢視文件

教學

取得適合初學者和進階開發人員的深入教學

檢視教學

資源

尋找開發資源並取得解答

查看資源