基于译文加权的BLEU改进方法.ppt
《基于译文加权的BLEU改进方法.ppt》由会员分享,可在线阅读,更多相关《基于译文加权的BLEU改进方法.ppt(24页珍藏版)》请在三一办公上搜索。
1、基于译文加权的BLEU改进方法,杨沐昀哈尔滨工业大学计算机学院机器智能与翻译研究室http:/,内容提要,引言BLEU用于汉语译文性能的实证分析基于线性回归的BLEU改进实验与分析,一、引言,BLEU:机器翻译自动评价方法基于N-gram精确率2002年IBM提出目前采用最广泛忽略译文的个性信息词性、连续正确译文长度基于译文加权BLEU改进,二、BLEU方法及分析,二、BLEU方法及分析,1、传统的BLEU方法 基本n-gram精确率公式:,count clip(N-gram)是 匹配的N元短语数;count(N-gram)是译文中N元短语总数。,针对短译文的简短惩罚因子:,c为译文的长度和;
2、r为与每个译文长度最接近的参考译文的长度和,二、BLEU方法及分析,1、传统的BLEU方法引入惩罚因子后,最终的BLEU计算公式如下所示:其中Wn是n元短语的权重,这里通常取Wn=1/N;N是取得最大的n元短语的元数,这里通常取 N=4。这样的BLEU的得分是一个0-1之间的数,较高的得分表示译文质量越高。接近1的得分表示候选译文和参考译文就已经非常接近了。,二、BLEU方法及分析,2、BLEU方法用于汉语译文性能分析数据:某英语水平考试英汉翻译试题1段英文、3个句子1个标准译文+3个手工译文 152篇翻译,阅卷点正式评分满分:12分,各分数段的文件数,二、BLEU方法及分析,2、BLEU方法
3、性能分析各种匹配条件下BLEU-4得分与人工评价得分相关系数,二、BLEU方法及分析,2、BLEU方法性能分析 4个参考译文时与人工评价的相关性较好;按字计算时与人工评价的相关性较好;无论是按字匹配,按词匹配,按词性匹配,还是按词与词性同时匹配的,BLEU的相关性都仅在0.6-07之间,二、BLEU方法及分析,2、BLEU方法性能分析平均对待任何译文不符合人工翻译评价的直觉不区分译文的种类:实词、虚词、还是标点符号 一个正确的名词译文 vs 一个正确介词译文不区分一个正确译文译出和连续多个正确译文 获得连续正确译文的难度要比获得一个正确译文的难度要大对于手工评价,连续正确译文给人重要的正面印象
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 译文 加权 BLEU 改进 方法
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5951983.html