快捷方式

ConstantKLController

class torchrl.data.ConstantKLController(*, kl_coef: Optional[float] = None, model: Optional[Module] = None)[source]

恆定 KL 控制器。

此控制器維持一個固定的係數,無論它更新的值為何。

關鍵字引數:
  • kl_coef (float) – 計算獎勵時,KL 相乘的係數。

  • model (nn.Module, 可選) – 需要控制的封裝模型。必須具有屬性 "kl_coef"。如果提供,"kl_coef" 將會就地更新。

文件

存取 PyTorch 的全面開發人員文件

檢視文件

教學課程

取得初學者和進階開發人員的深入教學課程

檢視教學課程

資源

尋找開發資源並獲得問題解答

檢視資源