HardUpdate¶
- class torchrl.objectives.HardUpdate(loss_module: Union['DQNLoss', 'DDPGLoss', 'SACLoss', 'TD3Loss'], *, value_network_update_interval: float = 1000)[來源]¶
Double DQN/DDPG 中用於目標網路更新的硬更新類別(與軟更新相反)。
這是在最初的 Double DQN 論文中提出的:「使用 Double Q-learning 的深度強化學習」,https://arxiv.org/abs/1509.06461。