torchaudio.datasets¶
所有資料集都是 torch.utils.data.Dataset
的子類別,並且實作了 __getitem__
和 __len__
方法。
因此,它們都可以傳遞給 torch.utils.data.DataLoader
,它可以使用 torch.multiprocessing
工作人員平行載入多個樣本。 例如
yesno_data = torchaudio.datasets.YESNO('.', download=True)
data_loader = torch.utils.data.DataLoader(
yesno_data,
batch_size=1,
shuffle=True,
num_workers=args.nThreads)
CMU ARCTIC [Kominek et al., 2003] 資料集。 |
|
CMU 發音字典 [Weide, 1998] (CMUDict) 資料集。 |
|
CommonVoice [Ardila et al., 2020] 資料集。 |
|
Device Recorded VCTK (小型子集版本) [Sarfjoo and Yamagishi, 2018] 資料集。 |
|
Fluent Speech Commands [Lugosch et al., 2019] 資料集 |
|
GTZAN [Tzanetakis et al., 2001] 資料集。 |
|
IEMOCAP [Busso et al., 2008] 資料集。 |
|
LibriMix [Cosentino et al., 2020] 資料集。 |
|
LibriSpeech [Panayotov et al., 2015] 資料集。 |
|
Libri-light 的子集 [Kahn et al., 2020] 資料集,用於 HuBERT [Hsu et al., 2021] 的監督式微調。 |
|
LibriTTS [Zen et al., 2019] 資料集。 |
|
LJSpeech-1.1 [Ito and Johnson, 2017] 資料集。 |
|
MUSDB_HQ [Rafii et al., 2019] 資料集。 |
|
QUESST14 [Miro et al., 2015] 資料集。 |
|
Snips [Coucke et al., 2018] 資料集。 |
|
Speech Commands [Warden, 2018] 資料集。 |
|
Tedlium [Rousseau et al., 2012] 資料集 (版本 1, 2 和 3)。 |
|
VCTK 0.92 [Yamagishi et al., 2019] 資料集 |
|
VoxCeleb1 [Nagrani et al., 2017] 資料集,用於說話者辨識任務。 |
|
VoxCeleb1 [Nagrani et al., 2017] 資料集,用於說話者驗證任務。 |
|
YesNo [YesNo, n.d.] 資料集。 |