目錄

捷徑

PSD¶

class torchaudio.transforms.PSD(multi_mask: bool = False, normalize: bool = True, eps: float = 1e-15)[source]¶

計算跨通道功率譜密度 (PSD) 矩陣。

參數:

multi_mask (bool, optional) – 如果 True，則只接受多通道時頻遮罩。(預設：False)
normalize (bool, optional) – 如果 True，則沿時間維度正規化遮罩。(預設：True)
eps (float, optional) – 在遮罩正規化中新增到分母的值。(預設：1e-15)

使用 PSD 的教學課程: 使用 MVDR 波束成形的語音增強

使用 MVDR 波束成形的語音增強

forward(specgram: Tensor, mask: Optional[Tensor] = None)[source]¶

參數:

specgram (torch.Tensor) – 多通道複數值頻譜。維度為 (…, channel, freq, time) 的張量。
mask (torch.Tensor 或 None, 可選) – 用於正規化的時頻遮罩。如果 multi_mask 為 False，則張量的維度為 (…, freq, time)；如果 multi_mask 為 True，則張量的維度為 (…, channel, freq, time)。（預設值：None）

回傳:

輸入頻譜的複數值 PSD 矩陣。: 維度為 (…, freq, channel, channel) 的張量

回傳類型:

文件

存取 PyTorch 的完整開發人員文件

檢視文件

教學

取得針對初學者和進階開發人員的深入教學課程

檢視教學課程

資源

尋找開發資源並取得問題的解答

檢視資源