torchaudio.functional.merge_tokens¶
- torchaudio.functional.merge_tokens(tokens: Tensor, scores: Tensor, blank: int = 0) List[TokenSpan] [原始碼]¶
從給定的 CTC 符記序列中移除重複的符記和空白符記。
- 參數:
tokens (Tensor) – 從
forced_align()
返回的對齊符記(未批次處理)。形狀:(time, )。scores (Tensor) – 從
forced_align()
返回的對齊分數(未批次處理)。形狀:(time, )。在計算符記大小分數時,給定的分數會在對應的時間跨度內平均。
- 返回:
TokenSpan 列表
範例
>>> aligned_tokens, scores = forced_align(emission, targets, input_lengths, target_lengths) >>> token_spans = merge_tokens(aligned_tokens[0], scores[0])
- 使用
merge_tokens
的教學