捷徑

torchaudio.functional.melscale_fbanks

torchaudio.functional.melscale_fbanks(n_freqs: int, f_min: float, f_max: float, n_mels: int, sample_rate: int, norm: Optional[str] = None, mel_scale: str = 'htk') Tensor[原始碼]

建立一個頻率區間轉換矩陣。

This feature supports the following devices: CPU This API supports the following properties: TorchScript

注意

為了與 librosa 保持數值相容性,產生的濾波器組並非所有係數的幅度都為 1。

Visualization of generated filter bank
參數:
  • n_freqs (int) – 要突出顯示/應用的頻率數量

  • f_min (float) – 最小頻率 (Hz)

  • f_max (float) – 最大頻率 (Hz)

  • n_mels (int) – Mel 濾波器組的數量

  • sample_rate (int) – 音訊波形的取樣率

  • norm (str or None, optional) – 若為 “slaney”,則將三角形 mel 權重除以 mel 頻帶的寬度(面積正規化)。(預設值:None

  • mel_scale (str, optional) – 要使用的縮放比例:htkslaney。(預設值:htk

回傳值:

大小為 (n_freqs, n_mels) 的三角形濾波器組 (fb 矩陣),表示要突出顯示/應用於 x 的頻率數量,以及濾波器組的數量。 每列都是一個濾波器組,因此假設有一個大小為 (…, n_freqs) 的矩陣 A,則應用結果將為 A @ melscale_fbanks(A.size(-1), ...)

回傳類型:

Tensor

使用 melscale_fbanks 的教學
Audio Feature Extractions

音訊特徵提取

音訊特徵提取

文件

存取 PyTorch 的完整開發人員文件

檢視文件

教學

取得針對初學者和高級開發人員的深入教學課程

檢視教學課程

資源

尋找開發資源並獲得問題解答

檢視資源