WorldModelWrapper¶ class torchrl.modules.tensordict_module.WorldModelWrapper(*args, **kwargs)[來源]¶ 世界模型封裝器。 此模組將轉換模型和獎勵模型封裝在一起。轉換模型用於預測一個想像的世界狀態。獎勵模型用於預測想像轉換的獎勵。 參數: transition_model (TensorDictModule) – 一個產生新世界狀態的轉換模型。 reward_model (TensorDictModule) – 一個獎勵模型,讀取世界狀態並回傳獎勵。 get_reward_operator() → TensorDictModule[來源]¶ 回傳一個獎勵運算子,將世界狀態映射到獎勵。 get_transition_model_operator() → TensorDictModule[來源]¶ 回傳一個轉換運算子,將觀測值映射到世界狀態,或將世界狀態映射到下一個世界狀態。