捷徑

PSD

class torchaudio.transforms.PSD(multi_mask: bool = False, normalize: bool = True, eps: float = 1e-15)[source]

計算跨通道功率譜密度 (PSD) 矩陣。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript
參數:
  • multi_mask (bool, optional) – 如果 True,則只接受多通道時頻遮罩。(預設:False)

  • normalize (bool, optional) – 如果 True,則沿時間維度正規化遮罩。(預設:True)

  • eps (float, optional) – 在遮罩正規化中新增到分母的值。(預設:1e-15)

使用 PSD 的教學課程
Speech Enhancement with MVDR Beamforming

使用 MVDR 波束成形的語音增強

使用 MVDR 波束成形的語音增強
forward(specgram: Tensor, mask: Optional[Tensor] = None)[source]
參數:
  • specgram (torch.Tensor) – 多通道複數值頻譜。 維度為 (…, channel, freq, time) 的張量。

  • mask (torch.TensorNone, 可選) – 用於正規化的時頻遮罩。如果 multi_mask 為 False,則張量的維度為 (…, freq, time);如果 multi_mask 為 True,則張量的維度為 (…, channel, freq, time)。(預設值:None

回傳:

輸入頻譜的複數值 PSD 矩陣。

維度為 (…, freq, channel, channel) 的張量

回傳類型:

torch.Tensor

文件

存取 PyTorch 的完整開發人員文件

檢視文件

教學

取得針對初學者和進階開發人員的深入教學課程

檢視教學課程

資源

尋找開發資源並取得問題的解答

檢視資源