torchtext.data.metrics¶
bleu_score¶
- torchtext.data.metrics.bleu_score(candidate_corpus, references_corpus, max_n=4, weights=[0.25, 0.25, 0.25, 0.25])[原始碼]¶
計算候選翻譯語料庫和參考翻譯語料庫之間的 BLEU 分數。基於 https://www.aclweb.org/anthology/P02-1040.pdf
- 參數::
candidate_corpus – 候選翻譯的可迭代對象。每個翻譯都是標記的可迭代對象
references_corpus – 參考翻譯的可迭代對象的可迭代對象。每個翻譯都是標記的可迭代對象
max_n – 我們要使用的最大 n-gram。例如,如果 max_n=3,我們將使用單字組、雙字組和三字組
weights – 用於每個 n-gram 類別的權重列表(預設為均勻)
範例
>>> from torchtext.data.metrics import bleu_score >>> candidate_corpus = [['My', 'full', 'pytorch', 'test'], ['Another', 'Sentence']] >>> references_corpus = [[['My', 'full', 'pytorch', 'test'], ['Completely', 'Different']], [['No', 'Match']]] >>> bleu_score(candidate_corpus, references_corpus) 0.8408964276313782