快捷方式

LibriMix

class torchaudio.datasets.LibriMix(root: Union[str, Path], subset: str = 'train-360', num_speakers: int = 2, sample_rate: int = 8000, task: str = 'sep_clean', mode: str = 'min')[source]

LibriMix [Cosentino et al., 2020] 資料集。

參數:
  • root (strPath) – 存放 Libri2MixLibri3Mix 目錄的路徑。不是這些目錄的實際路徑。

  • subset (str, optional) – 要使用的子集。選項:["train-360", "train-100", "dev", 和 "test"] (預設:"train-360")。

  • num_speakers (int, optional) – 說話者數量,決定要遍歷的目錄。資料集會遍歷 s1sN 目錄,以收集 N 個來源音訊。(預設:2)

  • sample_rate (int, optional) – 音訊檔案的取樣率。sample_rate 決定了從哪個子目錄獲取音訊。如果任何音訊具有不同的取樣率,則會引發 ValueError。選項:[8000, 16000] (預設:8000)

  • task (str, optional) – LibriMix 的任務。選項:["enh_single", "enh_both", "sep_clean", "sep_noisy"] (預設:"sep_clean")

  • mode (str, optional) – 建立混合音時的模式。如果設定為 "min",則混合音和來源的長度是所有來源的最小長度。 如果設定為 "max",則混合音和來源的長度會以零填充到所有來源的最大長度。選項:["min", "max"] (預設:"min")

注意

LibriMix 資料集需要手動生成。請查看 https://github.com/JorisCos/LibriMix

__getitem__

LibriMix.__getitem__(key: int) Tuple[int, Tensor, List[Tensor]][source]

從資料集中載入第 n 個樣本。

參數:

key (int) – 要載入的樣本的索引

傳回值:

以下項目的元組;

int

取樣率

Tensor

混合音訊波形

Tensor 列表

音源波形列表

get_metadata

LibriMix.get_metadata(key: int) Tuple[int, str, List[str]][source]

從資料集中取得第 n 個樣本的元資料。

參數:

key (int) – 要載入的樣本的索引

傳回值:

以下項目的元組;

int

取樣率

字串

混合音訊的路徑

字串列表

音源音訊的路徑列表

文件

存取 PyTorch 的完整開發人員文件

檢視文件

教學

取得針對初學者和進階開發人員的深入教學課程

檢視教學課程

資源

尋找開發資源並取得問題解答

檢視資源