IndependentNormal¶
- class torchrl.modules.IndependentNormal(loc: Tensor, scale: Tensor, upscale: float = 5.0, tanh_loc: bool = False, event_dim: int = 1, **kwargs)[原始碼]¶
實作具有位置縮放的常態分佈。
位置縮放可防止位置「過於遠離」0,最終導致數值不穩定的樣本和不良的梯度計算(例如,梯度爆炸)。 實際上,位置是根據
\[loc = tanh(loc / upscale) * upscale.\]計算得出。 可以透過關閉 tanh_loc 參數來停用此行為(請參閱下文)。
- 參數:
loc (torch.Tensor) – 常態分佈位置參數
scale (torch.Tensor) – 常態分佈 sigma 參數(變異數的平方根)
upscale (torch.Tensor 或 數字,選用) –
公式中的 'a' 縮放因子
\[loc = tanh(loc / upscale) * upscale.\]預設值為 5.0
tanh_loc (bool,選用) – 如果
False
,則上述公式用於位置縮放,否則保留原始值。 預設值為False
;
- property mode¶
傳回分佈的眾數。