快捷方式

RandomCropTensorDict

class torchrl.envs.transforms.RandomCropTensorDict(sub_seq_len: int, sample_dim: int = - 1, mask_key: Optional[NestedKey] = None)[原始碼]

用於 ReplayBuffer 和模組的軌跡子採樣器。

沿著輸入 tensordict 的最後一個維度,收集定義長度的子序列。這可用於從 ReplayBuffer 採樣的軌跡中取得裁剪的軌跡。

此轉換主要設計用於回放緩衝區和模組。目前,它不能用作環境轉換。如果需要此行為,請隨時透過 issue 提出要求。

參數:
  • sub_seq_len (int) – 要採樣的子軌跡的長度

  • sample_dim (int, optional) – 應發生裁剪的維度。應優先使用負維度,以使轉換對不同批次維度的 tensordict 具有魯棒性。預設值為 -1(TorchRL 中的預設時間維度)。

  • mask_key (NestedKey) – 如果提供,這表示在進行採樣時要尋找的遮罩鍵。如果提供,則只會傳回有效的元素。假設遮罩是一個布林張量,先是 True 值,然後是 False 值,而不是混合在一起。RandomCropTensorDict 不會檢查是否遵守此規定,因此由不正確的遮罩引起的任何錯誤都有可能被忽略。預設值:None(沒有遮罩鍵)。

forward(tensordict: TensorDictBase) TensorDictBase[原始碼]

讀取輸入 tensordict,並針對選定的鍵套用轉換。

文件

存取 PyTorch 的綜合開發者文件

檢視文件

教學

取得初學者和進階開發者的深入教學

檢視教學

資源

尋找開發資源並獲得解答

檢視資源