TEDLIUM¶

class torchaudio.datasets.TEDLIUM(root: Union[str, Path], release: str = 'release1', subset: str = 'train', download: bool = False, audio_ext: str = '.sph')[source]¶

Tedlium [Rousseau 等, 2012] 資料集 (版本 1, 2 和 3)。

參數:

root (str 或 Path) – 尋找或下載資料集的目錄路徑。
release (str, optional) – 發布版本。允許的值為 "release1"、 "release2" 或 "release3"。（預設值："release1"）。
subset (str, optional) – 要使用的資料集子集。有效選項為 "train"、 "dev" 和 "test"。預設為 "train"。
download (bool, optional) – 如果在根路徑下找不到資料集，是否下載。（預設值：False）。
audio_ext (str, optional) – 音訊檔的副檔名（預設值：".sph"）

屬性¶

phoneme_dict¶

property TEDLIUM.phoneme_dict¶

音素。從單字到音素元組的映射。請注意，某些單字具有空的音素。

類型:: dict[str, tuple[str]]

方法¶

getitem¶

TEDLIUM.__getitem__(n: int) → Tuple[Tensor, int, str, int, int, int][source]¶

從資料集中載入第 n 個樣本。

參數:

n (int) – 要載入的樣本的索引

傳回:

以下項目的元組；

Tensor: 波形
int: 取樣率
str: 文字稿
int: 演講 ID
int: 講者 ID
int: 識別符

TEDLIUM¶

屬性¶

phoneme_dict¶

方法¶

getitem¶

文件

教學

資源

TEDLIUM¶

屬性¶

phoneme_dict¶

方法¶

__getitem__¶

文件

教學

資源

getitem¶