torchaudio.datasets¶

所有資料集都是 torch.utils.data.Dataset 的子類別，並且實作了 __getitem__ 和 __len__ 方法。

因此，它們都可以傳遞給 torch.utils.data.DataLoader，它可以使用 torch.multiprocessing 工作人員平行載入多個樣本。例如

yesno_data = torchaudio.datasets.YESNO('.', download=True)
data_loader = torch.utils.data.DataLoader(
    yesno_data,
    batch_size=1,
    shuffle=True,
    num_workers=args.nThreads)

`CMUARCTIC`	CMU ARCTIC [Kominek et al., 2003] 資料集。
`CMUDict`	CMU 發音字典 [Weide, 1998] (CMUDict) 資料集。
`COMMONVOICE`	CommonVoice [Ardila et al., 2020] 資料集。
`DR_VCTK`	Device Recorded VCTK (小型子集版本) [Sarfjoo and Yamagishi, 2018] 資料集。
`FluentSpeechCommands`	Fluent Speech Commands [Lugosch et al., 2019] 資料集
`GTZAN`	GTZAN [Tzanetakis et al., 2001] 資料集。
`IEMOCAP`	IEMOCAP [Busso et al., 2008] 資料集。
`LibriMix`	LibriMix [Cosentino et al., 2020] 資料集。
`LIBRISPEECH`	LibriSpeech [Panayotov et al., 2015] 資料集。
`LibriLightLimited`	Libri-light 的子集 [Kahn et al., 2020] 資料集，用於 HuBERT [Hsu et al., 2021] 的監督式微調。
`LIBRITTS`	LibriTTS [Zen et al., 2019] 資料集。
`LJSPEECH`	LJSpeech-1.1 [Ito and Johnson, 2017] 資料集。
`MUSDB_HQ`	MUSDB_HQ [Rafii et al., 2019] 資料集。
`QUESST14`	QUESST14 [Miro et al., 2015] 資料集。
`Snips`	Snips [Coucke et al., 2018] 資料集。
`SPEECHCOMMANDS`	Speech Commands [Warden, 2018] 資料集。
`TEDLIUM`	Tedlium [Rousseau et al., 2012] 資料集 (版本 1, 2 和 3)。
`VCTK_092`	VCTK 0.92 [Yamagishi et al., 2019] 資料集
`VoxCeleb1Identification`	VoxCeleb1 [Nagrani et al., 2017] 資料集，用於說話者辨識任務。
`VoxCeleb1Verification`	VoxCeleb1 [Nagrani et al., 2017] 資料集，用於說話者驗證任務。
`YESNO`	YesNo [YesNo, n.d.] 資料集。

torchaudio.datasets¶

文件

教學

資源