torchaudio.functional.rtf_power¶

torchaudio.functional.rtf_power(psd_s: Tensor, psd_n: Tensor, reference_channel: Union[int, Tensor], n_iter: int = 3, diagonal_loading: bool = True, diag_eps: float = 1e-07) → Tensor[原始碼]¶

通過冪方法估計相對傳遞函數 (RTF) 或導向向量。

參數：

psd_s (torch.Tensor) – 目標語音的複數值功率譜密度 (PSD) 矩陣。維度為 (…, freq, channel, channel) 的 Tensor。
psd_n (torch.Tensor) – 雜訊的複數值功率譜密度（PSD）矩陣。形狀為 (…, freq, channel, channel) 的 Tensor。
reference_channel (int 或 torch.Tensor) – 指定參考通道。如果 dtype 是 int，它代表參考通道的索引。如果 dtype 是 torch.Tensor，它的形狀是 (…, channel)，其中 channel 維度是 one-hot 編碼。
diagonal_loading (bool, optional) – 如果 True，啟用對 psd_n 應用對角加載。（預設：True）
diag_eps (float, optional) – 對角加載時，乘以單位矩陣的係數。只有當 diagonal_loading 設定為 True 時才有效。（預設：1e-7）

回傳:

目標語音的估計複數值 RTF。形狀為 (…, freq, channel) 的 Tensor。

回傳類型:

torch.Tensor

文件