捷徑

torchaudio.prototype.models.conformer_wav2vec2_base

torchaudio.prototype.models.conformer_wav2vec2_base(extractor_input_dim: int = 64, extractor_output_dim: int = 256, encoder_projection_dropout: float = 0.0) Wav2Vec2Model[原始碼]

Conformer-Based Slef-Supervised Learning for Non-Speech Audio Tasks [Srivastava et al., 2022] 建構具有「小型」架構的 Conformer Wav2Vec2 模型

參數:
  • extractor_input_dim (int, optional) – 特徵提取器的輸入維度。(預設值:64)

  • extractor_output_dim (int, optional) – 特徵提取器的輸出維度。(預設值:256)

  • encoder_projection_dropout (float, optional) – 特徵投影後應用的 Dropout 機率。(預設值:0.0)

回傳值:

具有 conformer 編碼器和 base 組態的結果 wav2vec2 模型。

回傳類型:

Wav2Vec2Model

文件

存取 PyTorch 的完整開發者文件

檢視文件

教學

取得初學者和進階開發者的深入教學

檢視教學

資源

尋找開發資源並獲得問題解答

檢視資源