LibriMix¶

class torchaudio.datasets.LibriMix(root: Union[str, Path], subset: str = 'train-360', num_speakers: int = 2, sample_rate: int = 8000, task: str = 'sep_clean', mode: str = 'min')[source]¶

LibriMix [Cosentino et al., 2020] 資料集。

參數：

root (str 或 Path) – 存放 Libri2Mix 或 Libri3Mix 目錄的路徑。不是這些目錄的實際路徑。
subset (str, optional) – 要使用的子集。選項：["train-360", "train-100", "dev", 和 "test"] (預設："train-360")。
num_speakers (int, optional) – 說話者數量，決定要遍歷的目錄。資料集會遍歷 s1 到 sN 目錄，以收集 N 個來源音訊。(預設：2)
sample_rate (int, optional) – 音訊檔案的取樣率。sample_rate 決定了從哪個子目錄獲取音訊。如果任何音訊具有不同的取樣率，則會引發 ValueError。選項：[8000, 16000] (預設：8000)
task (str, optional) – LibriMix 的任務。選項：["enh_single", "enh_both", "sep_clean", "sep_noisy"] (預設："sep_clean")
mode (str, optional) – 建立混合音時的模式。如果設定為 "min"，則混合音和來源的長度是所有來源的最小長度。如果設定為 "max"，則混合音和來源的長度會以零填充到所有來源的最大長度。選項：["min", "max"] (預設："min")

注意

LibriMix 資料集需要手動生成。請查看 https://github.com/JorisCos/LibriMix

getitem¶

LibriMix.__getitem__(key: int) → Tuple[int, Tensor, List[Tensor]][source]¶

從資料集中載入第 n 個樣本。

參數：

key (int) – 要載入的樣本的索引

傳回值:

以下項目的元組；

int: 取樣率
Tensor: 混合音訊波形
Tensor 列表: 音源波形列表

get_metadata¶

LibriMix.get_metadata(key: int) → Tuple[int, str, List[str]][source]¶

從資料集中取得第 n 個樣本的元資料。

參數：

key (int) – 要載入的樣本的索引

傳回值:

以下項目的元組；

int: 取樣率
字串: 混合音訊的路徑
字串列表: 音源音訊的路徑列表

LibriMix¶

getitem¶

get_metadata¶

文件

教學

資源

LibriMix¶

__getitem__¶

get_metadata¶

文件

教學

資源

getitem¶