目錄

快捷方式

DreamerValueLoss¶

class torchrl.objectives.DreamerValueLoss(*args, **kwargs)[原始碼]¶

Dreamer Value Loss。

計算 dreamer value 模型的損失。 value 損失是在預測值和 lambda 目標之間計算的。

參考資料：https://arxiv.org/abs/1912.01603。

參數:

value_model (TensorDictModule) – value 模型。
value_loss (str, optional) – 用於 value 損失的損失。預設值："l2"。
discount_loss (bool, optional) – 如果 True，則損失會以 gamma 折扣因子進行折扣。預設值：False。
gamma (float, optional) – gamma 折扣因子。預設值：0.99。

forward(fake_data) → Tensor[原始碼]¶

它旨在讀取一個輸入 TensorDict 並傳回另一個具有名為「loss*」的損失鍵的 tensordict。

然後，訓練器可以使用將損失分成幾個部分，記錄整個訓練過程中的各種損失值。輸出 tensordict 中存在的其他純量也會被記錄。

參數:: tensordict – 一個輸入 tensordict，其中包含計算損失所需的值。
傳回:: 一個沒有批次維度的新 tensordict，包含各種損失純量，這些損失純量將被命名為「loss*」。損失必須以這個名稱傳回，因為它們會在反向傳播之前被訓練器讀取。

文件

存取 PyTorch 的完整開發者文件

查看文件

教學

取得初學者和進階開發人員的深入教學

查看教學

資源

尋找開發資源並獲得解答

查看資源