快捷鍵

torchaudio.functional.add_noise

torchaudio.functional.add_noise(waveform: Tensor, noise: Tensor, snr: Tensor, lengths: Optional[Tensor] = None) Tensor[source]

根據訊號雜訊比縮放波形並加入雜訊。

具體來說,對於每對波形向量 \(x \in \mathbb{R}^L\) 和雜訊向量 \(n \in \mathbb{R}^L\),此函數計算輸出 \(y\)

\[y = x + a n \, \text{,} \]

其中

\[a = \sqrt{ \frac{ ||x||_{2}^{2} }{ ||n||_{2}^{2} } \cdot 10^{-\frac{\text{SNR}}{10}} } \, \text{,} \]

其中 \(\text{SNR}\)\(x\)\(n\) 之間所需的訊號雜訊比,單位為 dB。

請注意,此函數以與上述公式和 PyTorch 的廣播語義一致的方式廣播其輸入中的單例前導維度。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript
參數:
  • waveform (torch.Tensor) – 輸入波形,形狀為 (…, L)

  • noise (torch.Tensor) – 雜訊,形狀為 (…, L) (與 waveform 相同形狀)。

  • snr (torch.Tensor) – 訊號雜訊比,單位為 dB,形狀為 (…,)

  • lengths (torch.TensorNone, optional) – waveformnoise 中訊號的有效長度,形狀為 (…,) (前導維度必須與 waveform 的維度相符)。如果為 None,則 waveformnoise 中的所有元素都將被視為有效。(預設值:None)

返回:

縮放並將 noise 加入 waveform 的結果,形狀為 (…, L) (與 waveform 相同形狀)。

返回類型:

torch.Tensor

使用 add_noise 的教學
Torchaudio-Squim: Non-intrusive Speech Assessment in TorchAudio

Torchaudio-Squim:TorchAudio 中的非侵入式語音評估

Torchaudio-Squim:TorchAudio 中的非侵入式語音評估
Audio Data Augmentation

音訊資料擴增

音訊資料擴增

文件

存取 PyTorch 的完整開發者文件

查看文件

教學

取得初學者和進階開發者的深入教學

查看教學

資源

尋找開發資源並獲得問題解答

查看資源