OpenMLEnv¶
- torchrl.envs.OpenMLEnv(*args, **kwargs)[原始碼]¶
OpenML 資料的環境介面,用於 Bandit 情境。
文件: https://www.openml.org/search?type=data
Scikit-learn 介面: https://scikit-learn.dev.org.tw/stable/modules/generated/sklearn.datasets.fetch_openml.html
- 參數:
dataset_name (str) – 支援的資料集如下:
"adult_num"
、"adult_onehot"
、"mushroom_num"
、"mushroom_onehot"
、"covertype"
、"shuttle"
和"magic"
。device (torch.device 或 相容, 選用) – 輸入和輸出資料預期所在的裝置。預設為
"cpu"
。batch_size (torch.Size 或 相容, 選用) – 環境的批次大小,即呼叫
reset()
時取樣並傳回的元素數量。預設為空的批次大小,即一次取樣一個元素。
- 變數:
available_envs (List[str]) – 此類別要建立的環境清單。
範例
>>> env = OpenMLEnv("adult_onehot", batch_size=[2, 3]) >>> print(env.reset()) TensorDict( fields={ done: Tensor(shape=torch.Size([2, 3, 1]), device=cpu, dtype=torch.bool, is_shared=False), observation: Tensor(shape=torch.Size([2, 3, 106]), device=cpu, dtype=torch.float32, is_shared=False), reward: Tensor(shape=torch.Size([2, 3, 1]), device=cpu, dtype=torch.float32, is_shared=False), y: Tensor(shape=torch.Size([2, 3]), device=cpu, dtype=torch.int64, is_shared=False)}, batch_size=torch.Size([2, 3]), device=cpu, is_shared=False)