捷徑

FrequencyMasking

class torchaudio.transforms.FrequencyMasking(freq_mask_param: int, iid_masks: bool = False)[原始碼]

在頻域中將遮罩應用於聲譜圖。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript

SpecAugment 中提出 [Park et al., 2019]

參數:
  • freq_mask_param (int) – 遮罩的最大可能長度。索引從 [0, freq_mask_param) 中均勻取樣。

  • iid_masks (bool, optional) – 是否將不同的遮罩應用於批次中的每個範例/通道。(預設:False)僅當輸入張量 >= 3D 時,此選項才適用。

範例
>>> spectrogram = torchaudio.transforms.Spectrogram()
>>> masking = torchaudio.transforms.FrequencyMasking(freq_mask_param=80)
>>>
>>> original = spectrogram(waveform)
>>> masked = masking(original)
The original spectrogram The spectrogram masked along frequency axis
使用 FrequencyMasking 的教學
Audio Feature Augmentation

音訊特徵擴增

音訊特徵擴增

文件

存取 PyTorch 的完整開發者文件

檢視文件

教學

取得初學者和進階開發人員的深入教學

檢視教學

資源

尋找開發資源並獲得解答

檢視資源