WAVLM_BASE¶
- torchaudio.pipelines.WAVLM_BASE¶
WavLM 基礎模型(“base” 架構),在來自 LibriSpeech 資料集的 960 小時未標記音訊上預訓練 [Panayotov et al., 2015],未經微調。
最初由 WavLM 的作者發布 [Chen et al., 2022],根據 MIT 許可證發布,並以相同許可證重新發布。[許可證, 來源]
請參考
torchaudio.pipelines.Wav2Vec2Bundle
以了解用法。