WAVLM_BASE_PLUS¶
- torchaudio.pipelines.WAVLM_BASE_PLUS¶
WavLM Base+ 模型(“base” 架構),在 60,000 小時的 Libri-Light 資料集 [Kahn et al., 2020]、10,000 小時的 GigaSpeech [Chen et al., 2021] 和 24,000 小時的 VoxPopuli [Wang et al., 2021] 上預訓練(“base” 架構),但未經過微調。
最初由 WavLM [Chen et al., 2022] 的作者在 MIT 許可證下發布,並以相同許可證重新發行。[許可證, 來源]
請參考
torchaudio.pipelines.Wav2Vec2Bundle
以了解用法。