• 文件 >
  • torchaudio.datasets >
  • 舊版本 (穩定)
捷徑

torchaudio.datasets

所有資料集都是 torch.utils.data.Dataset 的子類別,並且實作了 __getitem____len__ 方法。

因此,它們都可以傳遞給 torch.utils.data.DataLoader,它可以使用 torch.multiprocessing 工作人員平行載入多個樣本。 例如

yesno_data = torchaudio.datasets.YESNO('.', download=True)
data_loader = torch.utils.data.DataLoader(
    yesno_data,
    batch_size=1,
    shuffle=True,
    num_workers=args.nThreads)

CMUARCTIC

CMU ARCTIC [Kominek et al., 2003] 資料集。

CMUDict

CMU 發音字典 [Weide, 1998] (CMUDict) 資料集。

COMMONVOICE

CommonVoice [Ardila et al., 2020] 資料集。

DR_VCTK

Device Recorded VCTK (小型子集版本) [Sarfjoo and Yamagishi, 2018] 資料集。

FluentSpeechCommands

Fluent Speech Commands [Lugosch et al., 2019] 資料集

GTZAN

GTZAN [Tzanetakis et al., 2001] 資料集。

IEMOCAP

IEMOCAP [Busso et al., 2008] 資料集。

LibriMix

LibriMix [Cosentino et al., 2020] 資料集。

LIBRISPEECH

LibriSpeech [Panayotov et al., 2015] 資料集。

LibriLightLimited

Libri-light 的子集 [Kahn et al., 2020] 資料集,用於 HuBERT [Hsu et al., 2021] 的監督式微調。

LIBRITTS

LibriTTS [Zen et al., 2019] 資料集。

LJSPEECH

LJSpeech-1.1 [Ito and Johnson, 2017] 資料集。

MUSDB_HQ

MUSDB_HQ [Rafii et al., 2019] 資料集。

QUESST14

QUESST14 [Miro et al., 2015] 資料集。

Snips

Snips [Coucke et al., 2018] 資料集。

SPEECHCOMMANDS

Speech Commands [Warden, 2018] 資料集。

TEDLIUM

Tedlium [Rousseau et al., 2012] 資料集 (版本 1, 2 和 3)。

VCTK_092

VCTK 0.92 [Yamagishi et al., 2019] 資料集

VoxCeleb1Identification

VoxCeleb1 [Nagrani et al., 2017] 資料集,用於說話者辨識任務。

VoxCeleb1Verification

VoxCeleb1 [Nagrani et al., 2017] 資料集,用於說話者驗證任務。

YESNO

YesNo [YesNo, n.d.] 資料集。

文件

Access comprehensive developer documentation for PyTorch

View Docs

教學

Get in-depth tutorials for beginners and advanced developers

View Tutorials

資源

Find development resources and get your questions answered

View Resources