torchaudio.functional.merge_tokens¶

torchaudio.functional.merge_tokens(tokens: Tensor, scores: Tensor, blank: int = 0) → List[TokenSpan][原始碼]¶

從給定的 CTC 符記序列中移除重複的符記和空白符記。

參數:

tokens (Tensor) – 從 forced_align() 返回的對齊符記（未批次處理）。形狀：(time, )。
scores (Tensor) – 從 forced_align() 返回的對齊分數（未批次處理）。形狀：(time, )。在計算符記大小分數時，給定的分數會在對應的時間跨度內平均。

返回:

TokenSpan 列表

範例

>>> aligned_tokens, scores = forced_align(emission, targets, input_lengths, target_lengths)
>>> token_spans = merge_tokens(aligned_tokens[0], scores[0])

使用 merge_tokens 的教學: CTC 強制對齊 API 教學

CTC 強制對齊 API 教學

多語言資料的強制對齊

多語言資料的強制對齊

torchaudio.functional.merge_tokens¶

文件

教學

資源