FrequencyMasking¶

class torchaudio.transforms.FrequencyMasking(freq_mask_param: int, iid_masks: bool = False)[原始碼]¶

在頻域中將遮罩應用於聲譜圖。

在 SpecAugment 中提出 [Park et al., 2019]。

參數:

freq_mask_param (int) – 遮罩的最大可能長度。索引從 [0, freq_mask_param) 中均勻取樣。
iid_masks (bool, optional) – 是否將不同的遮罩應用於批次中的每個範例/通道。（預設：False）僅當輸入張量 >= 3D 時，此選項才適用。

範例

>>> spectrogram = torchaudio.transforms.Spectrogram()
>>> masking = torchaudio.transforms.FrequencyMasking(freq_mask_param=80)
>>>
>>> original = spectrogram(waveform)
>>> masked = masking(original)

The spectrogram masked along frequency axis

使用 FrequencyMasking 的教學

音訊特徵擴增

FrequencyMasking¶

文件

教學

資源