torchaudio.prototype.models¶

torchaudio.prototype.models 子封包包含用於處理常見音訊任務的模型定義。

注意

對於具有預訓練參數的模型，請參考 torchaudio.prototype.pipelines 模組。

模型定義負責建構計算圖並執行它們。

某些模型具有複雜的結構和變化。對於此類模型，提供工廠函數。

`ConformerWav2Vec2PretrainModel`	Conformer Wav2Vec2 預訓練模型，用於從頭開始訓練。
`ConvEmformer`	實作卷積增強串流轉換器架構，該架構於基於非因果卷積的串流轉換器轉導器語音辨識中提出 [Shi et al., 2022]。
`HiFiGANVocoder`	HiFi GAN 的生成器部分 [Kong et al., 2020]。

Beta 模型的原型工廠函數¶

某些模型定義處於 Beta 階段，但有些新的工廠函數仍處於原型階段。請查看每個模型中的「原型工廠函數」章節。

`Wav2Vec2Model`	wav2vec 2.0 中使用的聲學模型 [Baevski et al., 2020]。
`RNNT`	遞迴神經網路轉換器 (RNN-T) 模型。