目錄

捷徑

WorldModelWrapper¶

class torchrl.modules.tensordict_module.WorldModelWrapper(*args, **kwargs)[來源]¶

世界模型封裝器。

此模組將轉換模型和獎勵模型封裝在一起。轉換模型用於預測一個想像的世界狀態。獎勵模型用於預測想像轉換的獎勵。

參數:

transition_model (TensorDictModule) – 一個產生新世界狀態的轉換模型。
reward_model (TensorDictModule) – 一個獎勵模型，讀取世界狀態並回傳獎勵。

get_reward_operator() → TensorDictModule[來源]¶: 回傳一個獎勵運算子，將世界狀態映射到獎勵。

get_transition_model_operator() → TensorDictModule[來源]¶: 回傳一個轉換運算子，將觀測值映射到世界狀態，或將世界狀態映射到下一個世界狀態。

文件

取得 PyTorch 的完整開發者文件

檢視文件

教學

取得適用於初學者和進階開發者的深入教學

檢視教學

資源

尋找開發資源並取得解答

檢視資源