
资料内容:
一、BLEU (Bilingual Evaluation Understudy)
1.1 核心思想
BLEU由IBM于2002年提出,最初用于机器翻译评估。其核心假设:好的翻译与参考译
文共享更多的n-gram片段。
1.2 计算公式详解
BLEU是精确率导向的指标,由两部分组成:
步骤1:计算n-gram修正精确率(Modified Precision)
其中:
· Count(m-gram);候选译文中的n-gram出现次数
● Countalip(n-gram) = min(Count, Max_Ref_Count):截断计数,防止重复刷分
步骤2:短句惩罚因子(Brevity Penalty)
· c:候选译文长度
● r:参考译文长度(取最接近的)
步骤3:最终BLEU分数