捷徑

WorldModelWrapper

class torchrl.modules.tensordict_module.WorldModelWrapper(*args, **kwargs)[來源]

世界模型封裝器。

此模組將轉換模型和獎勵模型封裝在一起。轉換模型用於預測一個想像的世界狀態。獎勵模型用於預測想像轉換的獎勵。

參數:
  • transition_model (TensorDictModule) – 一個產生新世界狀態的轉換模型。

  • reward_model (TensorDictModule) – 一個獎勵模型,讀取世界狀態並回傳獎勵。

get_reward_operator() TensorDictModule[來源]

回傳一個獎勵運算子,將世界狀態映射到獎勵。

get_transition_model_operator() TensorDictModule[來源]

回傳一個轉換運算子,將觀測值映射到世界狀態,或將世界狀態映射到下一個世界狀態。

文件

取得 PyTorch 的完整開發者文件

檢視文件

教學

取得適用於初學者和進階開發者的深入教學

檢視教學

資源

尋找開發資源並取得解答

檢視資源