NoopResetEnv¶
- class torchrl.envs.transforms.NoopResetEnv(noops: int = 30, random: bool = True)[source]¶
重置環境時,執行一系列隨機動作。
- 參數:
env (EnvBase) – 在其上執行隨機動作的 env。可以是與提供給 TransformedEnv 類的 env 相同的 env
noops (int, optional) – 重置後執行的動作數上限。預設值為 30。如果 noops 太高,導致 env 在應用所有 noops 之前完成或截斷,則在多次試驗中,轉換會引發 RuntimeError。
random (bool, optional) – 如果為 False,則隨機操作的數量將始終等於 noops 值。如果為 True,則隨機動作的數量將在 0 到 noops 之間隨機選擇。預設值為 True。