資料集¶

Torchvision 在 torchvision.datasets 模組中提供了許多內建資料集，以及用於建立您自己的資料集的實用類別。

內建資料集¶

所有資料集都是 torch.utils.data.Dataset 的子類別，也就是說，它們已經實作了 __getitem__ 和 __len__ 方法。因此，它們都可以傳遞給 torch.utils.data.DataLoader，它可以透過使用 torch.multiprocessing 工作者並行載入多個樣本。例如

imagenet_data = torchvision.datasets.ImageNet('path/to/imagenet_root/')
data_loader = torch.utils.data.DataLoader(imagenet_data,
                                          batch_size=4,
                                          shuffle=True,
                                          num_workers=args.nThreads)

所有資料集都有幾乎相似的 API。它們都有兩個常見參數：transform 和 target_transform，分別用於轉換輸入和目標。您也可以使用提供的基礎類別來建立您自己的資料集。

警告

當使用 download=True 建立資料集物件時，檔案會先下載並解壓縮到根目錄中。此下載邏輯不是多進程安全的，因此如果在分散式環境中執行，可能會導致衝突/競爭條件。在分散式模式下，我們建議建立一個虛擬資料集物件，以在設定分散式模式之前觸發下載邏輯。

圖像分類¶

`Caltech101`(root[, target_type, transform, ...])	Caltech 101 資料集。
`Caltech256`(root[, transform, ...])	Caltech 256 資料集。
`CelebA`(root[, split, target_type, ...])	Large-scale CelebFaces Attributes (CelebA) Dataset 資料集。
`CIFAR10`(root[, train, transform, ...])	CIFAR10 資料集。
`CIFAR100`(root[, train, transform, ...])	CIFAR100 資料集。
`Country211`(root[, split, transform, ...])	來自 OpenAI 的 The Country211 Data Set 資料集。
`DTD`(root[, split, partition, transform, ...])	Describable Textures Dataset (DTD) 資料集.
`EMNIST`(root, split, **kwargs)	EMNIST 資料集。
`EuroSAT`(root[, transform, target_transform, ...])	EuroSAT 資料集的 RGB 版本。
`FakeData`([size, image_size, num_classes, ...])	一個偽造的資料集，它會回傳隨機產生的圖片，並將它們作為 PIL 圖片回傳。
`FashionMNIST`(root[, train, transform, ...])	Fashion-MNIST 資料集。
`FER2013`(root[, split, transform, ...])	FER2013 資料集。
`FGVCAircraft`(root[, split, ...])	FGVC Aircraft 資料集。
`Flickr8k`(root, ann_file[, transform, ...])	Flickr8k Entities 資料集。
`Flickr30k`(root, ann_file[, transform, ...])	Flickr30k Entities 資料集。
`Flowers102`(root[, split, transform, ...])	Oxford 102 Flower 資料集。
`Food101`(root[, split, transform, ...])	Food-101 資料集.
`GTSRB`(root[, split, transform, ...])	German Traffic Sign Recognition Benchmark (GTSRB) 資料集。
`INaturalist`(root[, version, target_type, ...])	iNaturalist 資料集。
`ImageNet`(root[, split])	ImageNet 2012 分類資料集。
`Imagenette`(root[, split, size, download, ...])	Imagenette 圖片分類資料集。
`KMNIST`(root[, train, transform, ...])	Kuzushiji-MNIST 資料集。
`LFWPeople`(root[, split, image_set, ...])	LFW 資料集。
`LSUN`(root[, classes, transform, ...])	LSUN 資料集。
`MNIST`(root[, train, transform, ...])	MNIST 資料集。
`Omniglot`(root[, background, transform, ...])	Omniglot 資料集。
`OxfordIIITPet`(root[, split, target_types, ...])	Oxford-IIIT Pet 資料集.
`Places365`(root, ~pathlib.Path], split, ...)	Places365 分類資料集。
`PCAM`(root[, split, transform, ...])	PCAM 資料集.
`QMNIST`(root[, what, compat, train])	QMNIST 資料集。
`RenderedSST2`(root[, split, transform, ...])	Rendered SST2 資料集.
`SEMEION`(root[, transform, target_transform, ...])	SEMEION 資料集。
`SBU`(root[, transform, target_transform, ...])	SBU Captioned Photo 資料集。
`StanfordCars`(root[, split, transform, ...])	Stanford Cars 資料集
`STL10`(root[, split, folds, transform, ...])	STL10 資料集。
`SUN397`(root[, transform, target_transform, ...])	SUN397 資料集.
`SVHN`(root[, split, transform, ...])	SVHN 資料集。
`USPS`(root[, train, transform, ...])	USPS 資料集。

影像偵測或分割¶

`CocoDetection`(root, annFile[, transform, ...])	MS Coco Detection 資料集。
`CelebA`(root[, split, target_type, ...])	Large-scale CelebFaces Attributes (CelebA) Dataset 資料集。
`Cityscapes`(root[, split, mode, target_type, ...])	Cityscapes 資料集。
`Kitti`(root[, train, transform, ...])	KITTI 資料集。
`OxfordIIITPet`(root[, split, target_types, ...])	Oxford-IIIT Pet 資料集.
`SBDataset`(root[, image_set, mode, download, ...])	語意邊界資料集
`VOCSegmentation`(root[, year, image_set, ...])	Pascal VOC 分割資料集。
`VOCDetection`(root[, year, image_set, ...])	Pascal VOC 偵測資料集。
`WIDERFace`(root[, split, transform, ...])	WIDERFace 資料集。

光流¶

`FlyingChairs`(root[, split, transforms])	FlyingChairs 光流資料集。
`FlyingThings3D`(root[, split, pass_name, ...])	FlyingThings3D 光流資料集。
`HD1K`(root[, split, transforms])	HD1K 光流資料集。
`KittiFlow`(root[, split, transforms])	KITTI 光流資料集 (2015)。
`Sintel`(root[, split, pass_name, transforms])	Sintel 光流資料集。

立體匹配¶

`CarlaStereo`(root[, transforms])	Carla 模擬器資料，連結在 CREStereo github repo 中。
`Kitti2012Stereo`(root[, split, transforms])	來自 2012 立體評估基準的 KITTI 資料集。
`Kitti2015Stereo`(root[, split, transforms])	來自 2015 立體評估基準的 KITTI 資料集。
`CREStereo`(root[, transforms])	訓練 CREStereo 架構時使用的合成資料集。
`FallingThingsStereo`(root[, variant, transforms])	FallingThings 資料集。
`SceneFlowStereo`(root[, variant, pass_name, ...])	Scene Flow 資料集的資料集介面。
`SintelStereo`(root[, pass_name, transforms])	Sintel 立體視覺資料集 (Stereo Dataset)。
`InStereo2k`(root[, split, transforms])	InStereo2k 資料集。
`ETH3DStereo`(root[, split, transforms])	ETH3D 低解析度雙視角 (Low-Res Two-View) 資料集。
`Middlebury2014Stereo`(root[, split, ...])	來自 Middlebury 資料集的公開場景 2014 版本 <https://vision.middlebury.edu/stereo/data/scenes2014/>。

圖像對 (Image pairs)¶

LFWPairs(root[, split, image_set, ...])

LFW 資料集。

PhotoTour(root, name[, train, transform, ...])

多視角立體對應 (Multi-view Stereo Correspondence) 資料集。

圖像描述 (Image captioning)¶

CocoCaptions(root, annFile[, transform, ...])

MS Coco Captions 資料集。

影片分類 (Video classification)¶

`HMDB51`(root, annotation_path, frames_per_clip)	HMDB51 資料集。
`Kinetics`(root, frames_per_clip[, ...])	通用 Kinetics (Generic Kinetics) 資料集。
`UCF101`(root, annotation_path, frames_per_clip)	UCF101 資料集。

影片預測 (Video prediction)¶

MovingMNIST(root[, split, split_ratio, ...])

MovingMNIST 資料集。

自訂資料集的基礎類別 (Base classes for custom datasets)¶

`DatasetFolder`(root, loader[, extensions, ...])	通用的資料載入器 (data loader)。
`ImageFolder`(root, ~pathlib.Path], transform, ...)	一個通用的資料載入器，預設情況下圖像會以此方式排列：。
`VisionDataset`([root, transforms, transform, ...])	用於創建與 torchvision 相容的資料集之基礎類別。

Transforms v2¶

wrap_dataset_for_transforms_v2(dataset[, ...])

包裝 torchvision.dataset 以便與 torchvision.transforms.v2 一起使用。