目錄

捷徑

Wav2Letter¶

class torchaudio.models.Wav2Letter(num_classes: int = 40, input_type: str = 'waveform', num_features: int = 1)[來源]¶

來自Wav2Letter：基於端到端 ConvNet 的語音辨識系統的 Wav2Letter 模型架構 [Collobert et al., 2016]。

另請參閱

訓練範例

參數:

num_classes (int, optional) – 要分類的類別數量。(預設值：40)
input_type (str, optional) – Wav2Letter 可以使用以下輸入：waveform、power_spectrum 或 mfcc (預設值：waveform)。
num_features (int, optional) – 網路將接收的輸入特徵數量 (預設值：1)。

方法¶

forward¶

Wav2Letter.forward(x: Tensor) → Tensor[source]¶

參數:: x (torch.Tensor) – 維度為 (batch_size, num_features, input_length) 的張量。
回傳:: 維度為 (batch_size, number_of_classes, input_length) 的預測張量。
回傳類型:: Tensor

文件

取得 PyTorch 的完整開發者文件

查看文件

教學

取得針對初學者和進階開發者的深入教學

查看教學

資源

尋找開發資源並取得問題解答

查看資源