捷徑

torchaudio.prototype.models

torchaudio.prototype.models 子封包包含用於處理常見音訊任務的模型定義。

注意

對於具有預訓練參數的模型,請參考 torchaudio.prototype.pipelines 模組。

模型定義負責建構計算圖並執行它們。

某些模型具有複雜的結構和變化。對於此類模型,提供工廠函數。

ConformerWav2Vec2PretrainModel

Conformer Wav2Vec2 預訓練模型,用於從頭開始訓練。

ConvEmformer

實作卷積增強串流轉換器架構,該架構於基於非因果卷積的串流轉換器轉導器語音辨識中提出 [Shi et al., 2022]

HiFiGANVocoder

HiFi GAN 的生成器部分 [Kong et al., 2020]

Beta 模型的原型工廠函數

某些模型定義處於 Beta 階段,但有些新的工廠函數仍處於原型階段。 請查看每個模型中的「原型工廠函數」章節。

Wav2Vec2Model

wav2vec 2.0 中使用的聲學模型 [Baevski et al., 2020]

RNNT

遞迴神經網路轉換器 (RNN-T) 模型。

文件

存取 PyTorch 的完整開發人員文件

檢視文件

教學

取得針對初學者和進階開發人員的深入教學課程

檢視教學課程

資源

尋找開發資源並取得您的問題解答

檢視資源