快捷鍵

torchaudio.functional.merge_tokens

torchaudio.functional.merge_tokens(tokens: Tensor, scores: Tensor, blank: int = 0) List[TokenSpan][原始碼]

從給定的 CTC 符記序列中移除重複的符記和空白符記。

參數:
  • tokens (Tensor) – 從 forced_align() 返回的對齊符記(未批次處理)。形狀:(time, )

  • scores (Tensor) – 從 forced_align() 返回的對齊分數(未批次處理)。形狀:(time, )。在計算符記大小分數時,給定的分數會在對應的時間跨度內平均。

返回:

TokenSpan 列表

範例

>>> aligned_tokens, scores = forced_align(emission, targets, input_lengths, target_lengths)
>>> token_spans = merge_tokens(aligned_tokens[0], scores[0])
使用 merge_tokens 的教學
CTC forced alignment API tutorial

CTC 強制對齊 API 教學

CTC 強制對齊 API 教學
Forced alignment for multilingual data

多語言資料的強制對齊

多語言資料的強制對齊

文件

存取 PyTorch 的完整開發者文件

查看文件

教學

取得初學者和進階開發者的深入教學

查看教學

資源

尋找開發資源並獲得問題解答

查看資源