ConstantKLController¶ class torchrl.data.ConstantKLController(*, kl_coef: Optional[float] = None, model: Optional[Module] = None)[source]¶ 恆定 KL 控制器。 此控制器維持一個固定的係數,無論它更新的值為何。 關鍵字引數: kl_coef (float) – 計算獎勵時,KL 相乘的係數。 model (nn.Module, 可選) – 需要控制的封裝模型。必須具有屬性 "kl_coef"。如果提供,"kl_coef" 將會就地更新。