DreamerValueLoss¶
- class torchrl.objectives.DreamerValueLoss(*args, **kwargs)[原始碼]¶
Dreamer Value Loss。
計算 dreamer value 模型的損失。 value 損失是在預測值和 lambda 目標之間計算的。
參考資料:https://arxiv.org/abs/1912.01603。
- 參數:
value_model (TensorDictModule) – value 模型。
value_loss (str, optional) – 用於 value 損失的損失。預設值:
"l2"
。discount_loss (bool, optional) – 如果
True
,則損失會以 gamma 折扣因子進行折扣。預設值:False。gamma (float, optional) – gamma 折扣因子。預設值:
0.99
。