快捷鍵

torchaudio.functional.inverse_spectrogram

torchaudio.functional.inverse_spectrogram(spectrogram: Tensor, length: Optional[int], pad: int, window: Tensor, n_fft: int, hop_length: int, win_length: int, normalized: Union[bool, str], center: bool = True, pad_mode: str = 'reflect', onesided: bool = True) Tensor[原始碼]

從提供的複數值頻譜圖建立反頻譜圖或一批反頻譜圖。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript
參數:
  • spectrogram (Tensor) – 音訊的複數張量,維度為 (…, freq, time)。

  • length (intNone) – 波形的輸出長度。

  • pad (int) – 訊號的雙邊填充。僅在提供 length 時有效。

  • window (Tensor) – 應用/乘法到每個幀/視窗的視窗張量

  • n_fft (int) – FFT 大小

  • hop_length (int) – STFT 視窗之間的跳躍長度

  • win_length (int) – 視窗大小

  • normalized (boolstr) – stft 輸出是否按幅度正規化。如果輸入為 str,則選項為 "window""frame_length",取決於正規化模式。True 對應到 "window"

  • center (bool, optional) – 波形是否在兩側填充,以便第 \(t\) 個幀以時間 \(t \times \text{hop\_length}\) 為中心。預設值:True

  • pad_mode (string, optional) – 控制當 centerTrue 時使用的填充方法。此參數是為了與頻譜圖函式相容而提供,並未使用。預設值:"reflect"

  • onesided (bool, optional) – 控制頻譜圖是否以單邊模式完成。預設值:True

返回:

維度 (…, time)。原始訊號的最小平方估計。

返回類型:

Tensor

文件

存取 PyTorch 的完整開發者文件

檢視文件

教學

取得初學者和進階開發者的深入教學

檢視教學

資源

尋找開發資源並獲得問題解答

檢視資源