torchaudio.functional.griffinlim¶
- torchaudio.functional.griffinlim(specgram: Tensor, window: Tensor, n_fft: int, hop_length: int, win_length: int, power: float, n_iter: int, momentum: float, length: Optional[int], rand_init: bool) Tensor [原始碼]¶
使用 Griffin-Lim 轉換,從線性尺度幅度頻譜圖計算波形。
實作移植自 librosa [Brian McFee et al., 2015]、A fast Griffin-Lim algorithm [Perraudin et al., 2013] 和 Signal estimation from modified short-time Fourier transform [Griffin and Lim, 1983]。
- 參數:
specgram (Tensor) – 維度為 (…, freq, frames) 的純幅度 STFT 頻譜圖,其中 freq 為
n_fft // 2 + 1
。window (Tensor) – 應用/乘法到每個影格/視窗的視窗張量
n_fft (int) – FFT 大小,建立
n_fft // 2 + 1
個 binhop_length (int) – STFT 視窗之間的跳躍長度。(預設值:
win_length // 2
)win_length (int) – 視窗大小。(預設值:
n_fft
)power (float) – 幅度頻譜圖的指數,(必須 > 0) 例如,幅度為 1,功率為 2,依此類推。
n_iter (int) – 相位恢復過程的迭代次數。
momentum (float) – 快速 Griffin-Lim 的動量參數。將此值設定為 0 會恢復原始 Griffin-Lim 方法。接近 1 的值可以加快收斂速度,但高於 1 的值可能不會收斂。
length (int 或 None) – 預期輸出的陣列長度。
rand_init (bool) – 如果為 True,則隨機初始化相位,否則初始化為零。
- 回傳:
波形 (…, time),其中 time 等於給定的
length
參數。- 回傳類型:
Tensor