torchaudio.functional.detect_pitch_frequency¶ torchaudio.functional.detect_pitch_frequency(waveform: Tensor, sample_rate: int, frame_time: float = 0.01, win_length: int = 30, freq_low: int = 85, freq_high: int = 3400) → Tensor[原始碼]¶ 偵測音高頻率。 它使用標準化的互相關函數和中位數平滑來實現。 參數: waveform (Tensor) – 音訊張量,維度為 (…, freq, time) sample_rate (int) – 波形的取樣率 (Hz) frame_time (float, optional) – 幀的持續時間(預設:10 ** (-2))。 win_length (int, optional) – 用於中位數平滑的視窗長度(以幀數計)(預設:30)。 freq_low (int, optional) – 可以偵測到的最低頻率 (Hz)(預設:85)。 freq_high (int, optional) – 可偵測到的最高頻率 (Hz) (預設值:3400)。 回傳: 頻率的 Tensor,維度為 (…, frame) 回傳類型: Tensor 使用 detect_pitch_frequency 的教學 音訊特徵提取 音訊特徵提取