torchaudio.functional.compute_deltas¶
- torchaudio.functional.compute_deltas(specgram: Tensor, win_length: int = 5, mode: str = 'replicate') Tensor [原始碼]¶
計算張量的 delta 係數,通常是頻譜圖
\[d_t = \frac{\sum_{n=1}^{\text{N}} n (c_{t+n} - c_{t-n})}{2 \sum_{n=1}^{\text{N}} n^2} \]其中 \(d_t\) 是時間 \(t\) 的 delta 值,\(c_t\) 是時間 \(t\) 的頻譜圖係數,\(N\) 是
(win_length-1)//2
。- 參數:
- 返回:
delta 張量,維度為 (…, freq, time)
- 返回類型:
Tensor
- 範例
>>> specgram = torch.randn(1, 40, 1000) >>> delta = compute_deltas(specgram) >>> delta2 = compute_deltas(delta)