torchaudio.functional.inverse_spectrogram¶

torchaudio.functional.inverse_spectrogram(spectrogram: Tensor, length: Optional[int], pad: int, window: Tensor, n_fft: int, hop_length: int, win_length: int, normalized: Union[bool, str], center: bool = True, pad_mode: str = 'reflect', onesided: bool = True) → Tensor[原始碼]¶

從提供的複數值頻譜圖建立反頻譜圖或一批反頻譜圖。

參數:

spectrogram (Tensor) – 音訊的複數張量，維度為 (…, freq, time)。
length (int 或 None) – 波形的輸出長度。
pad (int) – 訊號的雙邊填充。僅在提供 length 時有效。
window (Tensor) – 應用/乘法到每個幀/視窗的視窗張量
n_fft (int) – FFT 大小
hop_length (int) – STFT 視窗之間的跳躍長度
win_length (int) – 視窗大小
normalized (bool 或 str) – stft 輸出是否按幅度正規化。如果輸入為 str，則選項為 "window" 和 "frame_length"，取決於正規化模式。True 對應到 "window"。
center (bool, optional) – 波形是否在兩側填充，以便第 \(t\) 個幀以時間 \(t \times \text{hop\_length}\) 為中心。預設值：True
pad_mode (string, optional) – 控制當 center 為 True 時使用的填充方法。此參數是為了與頻譜圖函式相容而提供，並未使用。預設值："reflect"
onesided (bool, optional) – 控制頻譜圖是否以單邊模式完成。預設值：True

返回:

維度 (…, time)。原始訊號的最小平方估計。

返回類型:

Tensor

文件