SoftUpdate¶
- class torchrl.objectives.SoftUpdate(loss_module: Union['DQNLoss', 'DDPGLoss', 'SACLoss', 'REDQLoss', 'TD3Loss'], *, eps: float = None, tau: Optional[float] = None)[原始碼]¶
雙重 DQN/DDPG 中用於目標網路更新的軟更新類別。
這是在「使用深度強化學習進行連續控制」中提出的,https://arxiv.org/pdf/1509.02971.pdf
必須指定一個且只有一個衰減因子(tau 或 eps)。