NoisyLinear¶

class torchrl.modules.NoisyLinear(in_features: int, out_features: int, bias: bool = True, device: Optional[Union[device, str, int]] = None, dtype: Optional[dtype] = None, std_init: float = 0.1)[原始碼]¶

雜訊線性層。

在「用於探索的雜訊網路」中呈現，https://arxiv.org/abs/1706.10295v3

雜訊線性層是一個線性層，其權重添加了參數雜訊。這種誘導的隨機性可用於 RL 網路中，以協助代理程式的策略進行有效的探索。雜訊的參數與任何其他剩餘網路權重一起透過梯度下降學習。分解高斯雜訊是通常採用的雜訊類型。

參數:

in_features (int) – 輸入特徵維度
out_features (int) – 輸出特徵維度
bias (bool, optional) – 如果 True，則會在矩陣乘法中加入一個偏置項：Ax + b。預設值為 True
device (DEVICE_TYPING, optional) – 該層的裝置。預設值為 "cpu"
dtype (torch.dtype, optional) – 參數的 dtype。預設值為 None (預設的 pytorch dtype)
std_init (scalar, optional) – 最佳化之前高斯標準差的初始值。預設值為 0.1

NoisyLinear¶

文件

教程

資源