快捷鍵

TimeMasking

class torchaudio.transforms.TimeMasking(time_mask_param: int, iid_masks: bool = False, p: float = 1.0)[原始碼]

將遮罩應用於時域中的頻譜圖。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript

SpecAugment [Park et al., 2019] 中提出。

參數:
  • time_mask_param (int) – 遮罩的最大可能長度。索引從 [0, time_mask_param) 均勻取樣。

  • iid_masks (bool, optional) – 是否將不同的遮罩應用於批次中的每個範例/通道。(預設: False) 僅當輸入張量 >= 3D 時,此選項才適用。

  • p (float, optional) – 可以遮罩的最大時間步長比例。必須在範圍 [0.0, 1.0] 內。(預設: 1.0)

範例
>>> spectrogram = torchaudio.transforms.Spectrogram()
>>> masking = torchaudio.transforms.TimeMasking(time_mask_param=80)
>>>
>>> original = spectrogram(waveform)
>>> masked = masking(original)
The original spectrogram The spectrogram masked along time axis
使用 TimeMasking 的教學文件
Audio Feature Augmentation

音訊特徵擴增

音訊特徵擴增

文件

存取 PyTorch 的完整開發者文件

檢視文件

教學

取得針對初學者和進階開發者的深度教學

檢視教學

資源

尋找開發資源並獲得您的問題解答

檢視資源