快捷方式

HardUpdate

class torchrl.objectives.HardUpdate(loss_module: Union['DQNLoss', 'DDPGLoss', 'SACLoss', 'TD3Loss'], *, value_network_update_interval: float = 1000)[來源]

Double DQN/DDPG 中用於目標網路更新的硬更新類別(與軟更新相反)。

這是在最初的 Double DQN 論文中提出的:「使用 Double Q-learning 的深度強化學習」,https://arxiv.org/abs/1509.06461

參數:

loss_module (DQNLossDDPGLoss) – 應該更新目標網路的損失模組。

關鍵字參數:

value_network_update_interval (純量) – 應多久更新一次目標網路。預設值:1000

文件

取得 PyTorch 的完整開發人員文件

查看文件

教學

取得初學者和進階開發人員的深入教學

查看教學

資源

尋找開發資源並獲得解答

查看資源