DTLoss¶
- class torchrl.objectives.DTLoss(*args, **kwargs)[來源]¶
線上決策轉換器損失的 TorchRL 實作。
在 “決策轉換器:透過序列建模進行強化學習” <https://arxiv.org/abs/2106.01345> 中介紹
- 參數:
actor_network (ProbabilisticActor) – 隨機 actor
- 關鍵字引數:
loss_function (str) – 要使用的損失函數。預設為
"l2"
。reduction (str, optional) – 指定要應用於輸出的縮減:
"none"
|"mean"
|"sum"
。"none"
:不會應用縮減,"mean"
:輸出的總和將除以輸出中的元素數量,"sum"
:將對輸出求和。預設值:"mean"
。