Snips¶ class torchaudio.datasets.Snips(root: Union[str, Path], subset: str, speakers: Optional[List[str]] = None, audio_format: str = 'mp3')[source]¶ Snips [Coucke et al., 2018] 資料集。 參數: root (str 或 Path) – 根目錄,用於尋找資料集的頂層目錄。 subset (str) – 要使用的資料集子集。選項: ["train", "valid", "test"]. speakers (List[str] 或 None, optional) – 要包含在資料集中的講者列表。如果為 None,則包含子集中的所有講者。(預設值:None) audio_format (str, optional) – 音訊的副檔名。選項: ["mp3", "wav"]。 (預設值:"mp3") __getitem__¶ Snips.__getitem__(n: int) → Tuple[Tensor, int, str, str, str][source]¶ 從資料集中載入第 n 個樣本。 參數: n (int) – 要載入的樣本索引 Returns: Tensor波形 int取樣率 str檔案名稱 str音訊的轉錄 str轉錄的 Inside–outside–beginning (IOB) 標籤 str音訊的意圖標籤。 回傳類型: 以下項目的 Tuple get_metadata¶ Snips.get_metadata(n: int) → Tuple[str, int, str, str, str][source]¶ 取得資料集中第 n 個樣本的元數據。返回檔案路徑而不是波形,但其他欄位與 __getitem__() 返回的相同。 參數: n (int) – 要載入的樣本的索引。 Returns: str音訊路徑 int取樣率 str檔案名稱 str音訊的轉錄 str轉錄的 Inside–outside–beginning (IOB) 標籤 str音訊的意圖標籤。 回傳類型: 以下項目的 Tuple