捷徑

Wav2Letter

class torchaudio.models.Wav2Letter(num_classes: int = 40, input_type: str = 'waveform', num_features: int = 1)[來源]

來自Wav2Letter:基於端到端 ConvNet 的語音辨識系統的 Wav2Letter 模型架構 [Collobert et al., 2016]

另請參閱

參數:
  • num_classes (int, optional) – 要分類的類別數量。(預設值:40)

  • input_type (str, optional) – Wav2Letter 可以使用以下輸入:waveformpower_spectrummfcc (預設值:waveform)。

  • num_features (int, optional) – 網路將接收的輸入特徵數量 (預設值:1)。

方法

forward

Wav2Letter.forward(x: Tensor) Tensor[source]
參數:

x (torch.Tensor) – 維度為 (batch_size, num_features, input_length) 的張量。

回傳:

維度為 (batch_size, number_of_classes, input_length) 的預測張量。

回傳類型:

Tensor

文件

取得 PyTorch 的完整開發者文件

查看文件

教學

取得針對初學者和進階開發者的深入教學

查看教學

資源

尋找開發資源並取得問題解答

查看資源