快捷鍵

torchaudio.functional.rtf_power

torchaudio.functional.rtf_power(psd_s: Tensor, psd_n: Tensor, reference_channel: Union[int, Tensor], n_iter: int = 3, diagonal_loading: bool = True, diag_eps: float = 1e-07) Tensor[原始碼]

通過冪方法估計相對傳遞函數 (RTF) 或導向向量。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript
參數:
  • psd_s (torch.Tensor) – 目標語音的複數值功率譜密度 (PSD) 矩陣。 維度為 (…, freq, channel, channel) 的 Tensor。

  • psd_n (torch.Tensor) – 雜訊的複數值功率譜密度(PSD)矩陣。形狀為 (…, freq, channel, channel) 的 Tensor。

  • reference_channel (inttorch.Tensor) – 指定參考通道。如果 dtype 是 int,它代表參考通道的索引。如果 dtype 是 torch.Tensor,它的形狀是 (…, channel),其中 channel 維度是 one-hot 編碼。

  • diagonal_loading (bool, optional) – 如果 True,啟用對 psd_n 應用對角加載。(預設:True

  • diag_eps (float, optional) – 對角加載時,乘以單位矩陣的係數。 只有當 diagonal_loading 設定為 True 時才有效。(預設:1e-7

回傳:

目標語音的估計複數值 RTF。形狀為 (…, freq, channel) 的 Tensor。

回傳類型:

torch.Tensor

使用 rtf_power 的教學課程
Speech Enhancement with MVDR Beamforming

使用 MVDR 波束成形的語音增強

使用 MVDR 波束成形的語音增強

文件

取得 PyTorch 的完整開發者文件

檢視文件

教學

取得初學者和進階開發者的深入教學

檢視教學

資源

尋找開發資源並獲得您的問題解答

檢視資源