AdditiveGaussianModule¶
- class torchrl.modules.AdditiveGaussianModule(*args, **kwargs)[source]¶
加性高斯 PO 模組。
- 參數:
spec (TensorSpec) – 用於取樣動作的 spec。取樣的動作將在探索後投影到有效的動作空間上。
sigma_init (純量, 可選) – 初始 epsilon 值。預設值:1.0
sigma_end (純量, 可選) – 最終 epsilon 值。預設值:0.1
annealing_num_steps (int, 可選) – sigma 達到
sigma_end
值的步數。預設值:1000mean (float, 可選) – 每個輸出元素常態分佈的平均值。預設值:0.0
std (float, 可選) – 每個輸出元素常態分佈的標準差。預設值:1.0
- 關鍵字參數:
action_key (NestedKey, 可選) – 如果策略模組有多個輸出鍵,則其輸出 spec 將為 Composite 類型。需要知道在哪裡可以找到動作 spec。預設值:“action”
注意
在訓練迴圈中加入對
step()
的呼叫以更新探索因子至關重要。由於不容易捕捉到這個遺漏,如果省略了它,將不會引發任何警告或異常!