torchaudio.prototype.models¶
torchaudio.prototype.models
子封包包含用於處理常見音訊任務的模型定義。
注意
對於具有預訓練參數的模型,請參考 torchaudio.prototype.pipelines
模組。
模型定義負責建構計算圖並執行它們。
某些模型具有複雜的結構和變化。對於此類模型,提供工廠函數。
Conformer Wav2Vec2 預訓練模型,用於從頭開始訓練。 |
|
實作卷積增強串流轉換器架構,該架構於基於非因果卷積的串流轉換器轉導器語音辨識中提出 [Shi et al., 2022]。 |
|
HiFi GAN 的生成器部分 [Kong et al., 2020]。 |
Beta 模型的原型工廠函數¶
某些模型定義處於 Beta 階段,但有些新的工廠函數仍處於原型階段。 請查看每個模型中的「原型工廠函數」章節。
wav2vec 2.0 中使用的聲學模型 [Baevski et al., 2020]。 |
|
遞迴神經網路轉換器 (RNN-T) 模型。 |