torchaudio.functional.inverse_spectrogram¶
- torchaudio.functional.inverse_spectrogram(spectrogram: Tensor, length: Optional[int], pad: int, window: Tensor, n_fft: int, hop_length: int, win_length: int, normalized: Union[bool, str], center: bool = True, pad_mode: str = 'reflect', onesided: bool = True) Tensor [原始碼]¶
從提供的複數值頻譜圖建立反頻譜圖或一批反頻譜圖。
- 參數:
spectrogram (Tensor) – 音訊的複數張量,維度為 (…, freq, time)。
length (int 或 None) – 波形的輸出長度。
pad (int) – 訊號的雙邊填充。僅在提供
length
時有效。window (Tensor) – 應用/乘法到每個幀/視窗的視窗張量
n_fft (int) – FFT 大小
hop_length (int) – STFT 視窗之間的跳躍長度
win_length (int) – 視窗大小
normalized (bool 或 str) – stft 輸出是否按幅度正規化。如果輸入為 str,則選項為
"window"
和"frame_length"
,取決於正規化模式。True
對應到"window"
。center (bool, optional) – 波形是否在兩側填充,以便第 \(t\) 個幀以時間 \(t \times \text{hop\_length}\) 為中心。預設值:
True
pad_mode (string, optional) – 控制當
center
為True
時使用的填充方法。此參數是為了與頻譜圖函式相容而提供,並未使用。預設值:"reflect"
onesided (bool, optional) – 控制頻譜圖是否以單邊模式完成。預設值:
True
- 返回:
維度 (…, time)。原始訊號的最小平方估計。
- 返回類型:
Tensor