TimeStretch¶
- class torchaudio.transforms.TimeStretch(hop_length: Optional[int] = None, n_freq: int = 201, fixed_rate: Optional[float] = None)[原始碼]¶
在時間上延展 stft,而不會針對給定的速率修改音調。
在 SpecAugment [Park et al., 2019] 中提出。
- 參數:
注意
預期的輸入是原始的複數值頻譜圖。
- 範例
>>> spectrogram = torchaudio.transforms.Spectrogram(power=None) >>> stretch = torchaudio.transforms.TimeStretch() >>> >>> original = spectrogram(waveform) >>> stretched_1_2 = stretch(original, 1.2) >>> stretched_0_9 = stretch(original, 0.9)
- 使用
TimeStretch
的教學
- forward(complex_specgrams: Tensor, overriding_rate: Optional[float] = None) Tensor [原始碼]¶
- 參數:
complex_specgrams (Tensor) – 維度為 (…, freq, num_frame) 且具有複數 dtype 的張量。
overriding_rate (float 或 None,選用) – 套用於此批次的加速。如果未傳遞速率,則使用
self.fixed_rate
。(預設值:None
)
- 回傳值:
延展的頻譜圖。產生的張量與輸入頻譜圖具有對應的複數 dtype,並且影格數更改為
ceil(num_frame / rate)
。- 回傳類型:
Tensor