目錄

捷徑

DTLoss¶

class torchrl.objectives.DTLoss(*args, **kwargs)[來源]¶

線上決策轉換器損失的 TorchRL 實作。

在 “決策轉換器：透過序列建模進行強化學習” <https://arxiv.org/abs/2106.01345> 中介紹

參數:

actor_network (ProbabilisticActor) – 隨機 actor

關鍵字引數:

loss_function (str) – 要使用的損失函數。預設為 "l2"。
reduction (str, optional) – 指定要應用於輸出的縮減： "none" | "mean" | "sum"。"none"：不會應用縮減，"mean"：輸出的總和將除以輸出中的元素數量，"sum"：將對輸出求和。預設值： "mean"。

forward(tensordict: TensorDictBase = None) → TensorDictBase[來源]¶: 計算線上決策轉換器的損失。

文件

取得 PyTorch 的完整開發者文件

檢視文件

教學

取得適合初學者和進階開發人員的深入教學

檢視教學

資源

尋找開發資源並獲得問題解答

檢視資源