捷徑

torchaudio.functional.griffinlim

torchaudio.functional.griffinlim(specgram: Tensor, window: Tensor, n_fft: int, hop_length: int, win_length: int, power: float, n_iter: int, momentum: float, length: Optional[int], rand_init: bool) Tensor[原始碼]

使用 Griffin-Lim 轉換,從線性尺度幅度頻譜圖計算波形。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript

實作移植自 librosa [Brian McFee et al., 2015]A fast Griffin-Lim algorithm [Perraudin et al., 2013]Signal estimation from modified short-time Fourier transform [Griffin and Lim, 1983]

參數:
  • specgram (Tensor) – 維度為 (…, freq, frames) 的純幅度 STFT 頻譜圖,其中 freq 為 n_fft // 2 + 1

  • window (Tensor) – 應用/乘法到每個影格/視窗的視窗張量

  • n_fft (int) – FFT 大小,建立 n_fft // 2 + 1 個 bin

  • hop_length (int) – STFT 視窗之間的跳躍長度。(預設值:win_length // 2)

  • win_length (int) – 視窗大小。(預設值:n_fft)

  • power (float) – 幅度頻譜圖的指數,(必須 > 0) 例如,幅度為 1,功率為 2,依此類推。

  • n_iter (int) – 相位恢復過程的迭代次數。

  • momentum (float) – 快速 Griffin-Lim 的動量參數。將此值設定為 0 會恢復原始 Griffin-Lim 方法。接近 1 的值可以加快收斂速度,但高於 1 的值可能不會收斂。

  • length (intNone) – 預期輸出的陣列長度。

  • rand_init (bool) – 如果為 True,則隨機初始化相位,否則初始化為零。

回傳:

波形 (…, time),其中 time 等於給定的 length 參數。

回傳類型:

Tensor

文件

存取 PyTorch 的完整開發者文件

檢視文件

教學

取得為初學者和進階開發者提供的深入教學

檢視教學

資源

尋找開發資源並獲得問題解答

檢視資源