OpenMLEnv¶

torchrl.envs.OpenMLEnv(*args, **kwargs)[原始碼]¶

OpenML 資料的環境介面，用於 Bandit 情境。

文件： https://www.openml.org/search?type=data

Scikit-learn 介面： https://scikit-learn.dev.org.tw/stable/modules/generated/sklearn.datasets.fetch_openml.html

參數:

dataset_name (str) – 支援的資料集如下： "adult_num"、 "adult_onehot"、 "mushroom_num"、 "mushroom_onehot"、 "covertype"、 "shuttle" 和 "magic"。
device (torch.device 或相容, 選用) – 輸入和輸出資料預期所在的裝置。預設為 "cpu"。
batch_size (torch.Size 或相容, 選用) – 環境的批次大小，即呼叫 reset() 時取樣並傳回的元素數量。預設為空的批次大小，即一次取樣一個元素。

變數:

available_envs (List[str]) – 此類別要建立的環境清單。

範例

>>> env = OpenMLEnv("adult_onehot", batch_size=[2, 3])
>>> print(env.reset())
TensorDict(
    fields={
        done: Tensor(shape=torch.Size([2, 3, 1]), device=cpu, dtype=torch.bool, is_shared=False),
        observation: Tensor(shape=torch.Size([2, 3, 106]), device=cpu, dtype=torch.float32, is_shared=False),
        reward: Tensor(shape=torch.Size([2, 3, 1]), device=cpu, dtype=torch.float32, is_shared=False),
        y: Tensor(shape=torch.Size([2, 3]), device=cpu, dtype=torch.int64, is_shared=False)},
    batch_size=torch.Size([2, 3]),
    device=cpu,
    is_shared=False)

OpenMLEnv¶

文件

教學

資源