make_collector_offpolicy¶
- torchrl.trainers.helpers.make_collector_offpolicy(make_env: Callable[[], EnvBase], actor_model_explore: Union[TensorDictModuleWrapper, ProbabilisticTensorDictSequential], cfg: DictConfig, make_env_kwargs: Optional[Dict] = None) DataCollectorBase [來源]¶
傳回用於離線策略 sota 實作的資料收集器。
- 參數:
make_env (Callable) – 環境建立器
actor_model_explore (SafeModule) – 用於評估和探索更新的模型實例
cfg (DictConfig) – 用於建立收集器物件的設定
make_env_kwargs (dict) – env 建立器的 kwargs