捷徑

VIPRewardTransform

class torchrl.envs.transforms.VIPRewardTransform(*args, **kwargs)[原始碼]

一個 VIP 轉換,用於根據嵌入相似性計算獎勵。

此類別將更新獎勵計算

forward(tensordict)[原始碼]

讀取輸入 tensordict,並針對選定的鍵套用轉換。

transform_input_spec(input_spec: TensorSpec) TensorSpec[原始碼]

轉換輸入規格,使結果規格與轉換映射匹配。

參數:

input_spec (TensorSpec) – 轉換前的規格

回傳:

轉換後的預期規格

文件

存取 PyTorch 的完整開發者文件

檢視文件

教學

取得針對初學者和進階開發者的深入教學

檢視教學

資源

尋找開發資源並取得問題解答

檢視資源