目錄

快速連結

torchaudio.prototype.models.emformer_hubert_base¶

torchaudio.prototype.models.emformer_hubert_base(extractor_input_dim: int = 80, extractor_output_dim: int = 128, encoder_dropout: float = 0.1, aux_num_out: Optional[int] = None) → Wav2Vec2Model[原始碼]¶

建構具有 20 個 Emformer 層的 Emformer HuBERT 模型。

參數:

extractor_input_dim (int, optional) – 特徵提取器的輸入維度。（預設值：80）
extractor_output_dim (int, optional) – 特徵提取器後的輸出維度。（預設值：128）
encoder_dropout (float, optional) – Emformer 中的 Dropout 概率。（預設值：0.1）
aux_num_out (int 或 None, optional) – 用於微調的輔助層輸出維度。（預設值：None）

返回:

結果 torchaudio.models.Wav2Vec2Model 模型，帶有 torchaudio.models.Emformer 編碼器。

返回類型:

文件

存取 PyTorch 的完整開發者文件

檢視文件

教學

取得初學者和進階開發者的深入教學

檢視教學

資源

尋找開發資源並獲得問題解答

檢視資源