WAV2VEC2_ASR_BASE_100H¶

torchaudio.pipelines.WAV2VEC2_ASR_BASE_100H¶

Wav2vec 2.0 模型 (具有額外線性模組的「base」架構)，在來自 LibriSpeech 資料集 [Panayotov et al., 2015] 的 960 小時未標記音訊（「train-clean-100」、「train-clean-360」和「train-other-500」的組合）上進行預訓練，並在來自「train-clean-100」子集的 100 小時轉錄音訊上針對 ASR 進行微調。