BinarizeReward¶
- class torchrl.envs.transforms.BinarizeReward(in_keys: Optional[Sequence[NestedKey]] = None, out_keys: Optional[Sequence[NestedKey]] = None)[原始碼]¶
如果獎勵為空值或非空值,則將獎勵映射到二進位值 (0 或 1)。
- 參數:
in_keys (List[NestedKey]) – 輸入鍵
out_keys (List[NestedKey], optional) – 輸出鍵。預設為
in_keys
的值。dtype (torch.dtype, optional) – 二元化獎勵的 dtype。預設為
torch.int8
。
- transform_reward_spec(reward_spec: TensorSpec) TensorSpec [原始碼]¶
轉換獎勵規格,使產生的規格與轉換映射匹配。
- 參數:
reward_spec (TensorSpec) – 轉換前的規格
- 傳回:
轉換後的預期規格