捷徑

資料集

Torchvision 在 torchvision.datasets 模組中提供了許多內建資料集,以及用於建立您自己的資料集的實用類別。

內建資料集

所有資料集都是 torch.utils.data.Dataset 的子類別,也就是說,它們已經實作了 __getitem____len__ 方法。 因此,它們都可以傳遞給 torch.utils.data.DataLoader,它可以透過使用 torch.multiprocessing 工作者並行載入多個樣本。 例如

imagenet_data = torchvision.datasets.ImageNet('path/to/imagenet_root/')
data_loader = torch.utils.data.DataLoader(imagenet_data,
                                          batch_size=4,
                                          shuffle=True,
                                          num_workers=args.nThreads)

所有資料集都有幾乎相似的 API。 它們都有兩個常見參數:transformtarget_transform,分別用於轉換輸入和目標。 您也可以使用提供的 基礎類別 來建立您自己的資料集。

警告

當使用 download=True 建立資料集物件時,檔案會先下載並解壓縮到根目錄中。 此下載邏輯不是多進程安全的,因此如果在分散式環境中執行,可能會導致衝突/競爭條件。 在分散式模式下,我們建議建立一個虛擬資料集物件,以在設定分散式模式之前觸發下載邏輯。

圖像分類

Caltech101(root[, target_type, transform, ...])

Caltech 101 資料集。

Caltech256(root[, transform, ...])

Caltech 256 資料集。

CelebA(root[, split, target_type, ...])

Large-scale CelebFaces Attributes (CelebA) Dataset 資料集。

CIFAR10(root[, train, transform, ...])

CIFAR10 資料集。

CIFAR100(root[, train, transform, ...])

CIFAR100 資料集。

Country211(root[, split, transform, ...])

來自 OpenAI 的 The Country211 Data Set 資料集。

DTD(root[, split, partition, transform, ...])

Describable Textures Dataset (DTD) 資料集.

EMNIST(root, split, **kwargs)

EMNIST 資料集。

EuroSAT(root[, transform, target_transform, ...])

EuroSAT 資料集的 RGB 版本。

FakeData([size, image_size, num_classes, ...])

一個偽造的資料集,它會回傳隨機產生的圖片,並將它們作為 PIL 圖片回傳。

FashionMNIST(root[, train, transform, ...])

Fashion-MNIST 資料集。

FER2013(root[, split, transform, ...])

FER2013 資料集。

FGVCAircraft(root[, split, ...])

FGVC Aircraft 資料集。

Flickr8k(root, ann_file[, transform, ...])

Flickr8k Entities 資料集。

Flickr30k(root, ann_file[, transform, ...])

Flickr30k Entities 資料集。

Flowers102(root[, split, transform, ...])

Oxford 102 Flower 資料集。

Food101(root[, split, transform, ...])

Food-101 資料集.

GTSRB(root[, split, transform, ...])

German Traffic Sign Recognition Benchmark (GTSRB) 資料集。

INaturalist(root[, version, target_type, ...])

iNaturalist 資料集。

ImageNet(root[, split])

ImageNet 2012 分類資料集。

Imagenette(root[, split, size, download, ...])

Imagenette 圖片分類資料集。

KMNIST(root[, train, transform, ...])

Kuzushiji-MNIST 資料集。

LFWPeople(root[, split, image_set, ...])

LFW 資料集。

LSUN(root[, classes, transform, ...])

LSUN 資料集。

MNIST(root[, train, transform, ...])

MNIST 資料集。

Omniglot(root[, background, transform, ...])

Omniglot 資料集。

OxfordIIITPet(root[, split, target_types, ...])

Oxford-IIIT Pet 資料集.

Places365(root, ~pathlib.Path], split, ...)

Places365 分類資料集。

PCAM(root[, split, transform, ...])

PCAM 資料集.

QMNIST(root[, what, compat, train])

QMNIST 資料集。

RenderedSST2(root[, split, transform, ...])

Rendered SST2 資料集.

SEMEION(root[, transform, target_transform, ...])

SEMEION 資料集。

SBU(root[, transform, target_transform, ...])

SBU Captioned Photo 資料集。

StanfordCars(root[, split, transform, ...])

Stanford Cars 資料集

STL10(root[, split, folds, transform, ...])

STL10 資料集。

SUN397(root[, transform, target_transform, ...])

SUN397 資料集.

SVHN(root[, split, transform, ...])

SVHN 資料集。

USPS(root[, train, transform, ...])

USPS 資料集。

影像偵測或分割

CocoDetection(root, annFile[, transform, ...])

MS Coco Detection 資料集。

CelebA(root[, split, target_type, ...])

Large-scale CelebFaces Attributes (CelebA) Dataset 資料集。

Cityscapes(root[, split, mode, target_type, ...])

Cityscapes 資料集。

Kitti(root[, train, transform, ...])

KITTI 資料集。

OxfordIIITPet(root[, split, target_types, ...])

Oxford-IIIT Pet 資料集.

SBDataset(root[, image_set, mode, download, ...])

語意邊界資料集

VOCSegmentation(root[, year, image_set, ...])

Pascal VOC 分割資料集。

VOCDetection(root[, year, image_set, ...])

Pascal VOC 偵測資料集。

WIDERFace(root[, split, transform, ...])

WIDERFace 資料集。

光流

FlyingChairs(root[, split, transforms])

FlyingChairs 光流資料集。

FlyingThings3D(root[, split, pass_name, ...])

FlyingThings3D 光流資料集。

HD1K(root[, split, transforms])

HD1K 光流資料集。

KittiFlow(root[, split, transforms])

KITTI 光流資料集 (2015)。

Sintel(root[, split, pass_name, transforms])

Sintel 光流資料集。

立體匹配

CarlaStereo(root[, transforms])

Carla 模擬器資料,連結在 CREStereo github repo 中。

Kitti2012Stereo(root[, split, transforms])

來自 2012 立體評估基準 的 KITTI 資料集。

Kitti2015Stereo(root[, split, transforms])

來自 2015 立體評估基準 的 KITTI 資料集。

CREStereo(root[, transforms])

訓練 CREStereo 架構時使用的合成資料集。

FallingThingsStereo(root[, variant, transforms])

FallingThings 資料集。

SceneFlowStereo(root[, variant, pass_name, ...])

Scene Flow 資料集的資料集介面。

SintelStereo(root[, pass_name, transforms])

Sintel 立體視覺資料集 (Stereo Dataset)

InStereo2k(root[, split, transforms])

InStereo2k 資料集。

ETH3DStereo(root[, split, transforms])

ETH3D 低解析度雙視角 (Low-Res Two-View) 資料集。

Middlebury2014Stereo(root[, split, ...])

來自 Middlebury 資料集的公開場景 2014 版本 <https://vision.middlebury.edu/stereo/data/scenes2014/>

圖像對 (Image pairs)

LFWPairs(root[, split, image_set, ...])

LFW 資料集。

PhotoTour(root, name[, train, transform, ...])

多視角立體對應 (Multi-view Stereo Correspondence) 資料集。

圖像描述 (Image captioning)

CocoCaptions(root, annFile[, transform, ...])

MS Coco Captions 資料集。

影片分類 (Video classification)

HMDB51(root, annotation_path, frames_per_clip)

HMDB51 資料集。

Kinetics(root, frames_per_clip[, ...])

通用 Kinetics (Generic Kinetics) 資料集。

UCF101(root, annotation_path, frames_per_clip)

UCF101 資料集。

影片預測 (Video prediction)

MovingMNIST(root[, split, split_ratio, ...])

MovingMNIST 資料集。

自訂資料集的基礎類別 (Base classes for custom datasets)

DatasetFolder(root, loader[, extensions, ...])

通用的資料載入器 (data loader)。

ImageFolder(root, ~pathlib.Path], transform, ...)

一個通用的資料載入器,預設情況下圖像會以此方式排列:。

VisionDataset([root, transforms, transform, ...])

用於創建與 torchvision 相容的資料集之基礎類別。

Transforms v2

wrap_dataset_for_transforms_v2(dataset[, ...])

包裝 torchvision.dataset 以便與 torchvision.transforms.v2 一起使用。

文件

取得 PyTorch 的完整開發者文件

檢視文件 (View Docs)

教學 (Tutorials)

取得初學者和進階開發人員的深入教學

檢視教學 (View Tutorials)

資源 (Resources)

尋找開發資源並取得問題解答

檢視資源 (View Resources)