快捷方式

IndependentNormal

class torchrl.modules.IndependentNormal(loc: Tensor, scale: Tensor, upscale: float = 5.0, tanh_loc: bool = False, event_dim: int = 1, **kwargs)[原始碼]

實作具有位置縮放的常態分佈。

位置縮放可防止位置「過於遠離」0,最終導致數值不穩定的樣本和不良的梯度計算(例如,梯度爆炸)。 實際上,位置是根據

\[loc = tanh(loc / upscale) * upscale.\]

計算得出。 可以透過關閉 tanh_loc 參數來停用此行為(請參閱下文)。

參數:
  • loc (torch.Tensor) – 常態分佈位置參數

  • scale (torch.Tensor) – 常態分佈 sigma 參數(變異數的平方根)

  • upscale (torch.Tensor數字選用) –

    公式中的 'a' 縮放因子

    \[loc = tanh(loc / upscale) * upscale.\]

    預設值為 5.0

  • tanh_loc (bool選用) – 如果 False,則上述公式用於位置縮放,否則保留原始值。 預設值為 False

property mode

傳回分佈的眾數。

文件

存取 PyTorch 的完整開發者文件

檢視文件

教學

取得初學者和進階開發人員的深入教學課程

檢視教學課程

資源

尋找開發資源並獲得問題解答

檢視資源