捷徑

TEDLIUM

class torchaudio.datasets.TEDLIUM(root: Union[str, Path], release: str = 'release1', subset: str = 'train', download: bool = False, audio_ext: str = '.sph')[source]

Tedlium [Rousseau , 2012] 資料集 (版本 1, 2 和 3)。

參數:
  • root (strPath) – 尋找或下載資料集的目錄路徑。

  • release (str, optional) – 發布版本。允許的值為 "release1""release2""release3"。(預設值:"release1")。

  • subset (str, optional) – 要使用的資料集子集。有效選項為 "train""dev""test"。預設為 "train"

  • download (bool, optional) – 如果在根路徑下找不到資料集,是否下載。(預設值:False)。

  • audio_ext (str, optional) – 音訊檔的副檔名(預設值:".sph"

屬性

phoneme_dict

property TEDLIUM.phoneme_dict

音素。從單字到音素元組的映射。請注意,某些單字具有空的音素。

類型:

dict[str, tuple[str]]

方法

__getitem__

TEDLIUM.__getitem__(n: int) Tuple[Tensor, int, str, int, int, int][source]

從資料集中載入第 n 個樣本。

參數:

n (int) – 要載入的樣本的索引

傳回:

以下項目的元組;

Tensor

波形

int

取樣率

str

文字稿

int

演講 ID

int

講者 ID

int

識別符

文件

存取 PyTorch 的完整開發者文件

檢視文件

教學

取得針對初學者和進階開發者的深入教學課程

檢視教學課程

資源

尋找開發資源並獲得您的問題解答

檢視資源