欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    基于译文加权的BLEU改进方法.ppt

    • 资源ID:5951983       资源大小:332.61KB        全文页数:24页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    基于译文加权的BLEU改进方法.ppt

    基于译文加权的BLEU改进方法,杨沐昀哈尔滨工业大学计算机学院机器智能与翻译研究室http:/,内容提要,引言BLEU用于汉语译文性能的实证分析基于线性回归的BLEU改进实验与分析,一、引言,BLEU:机器翻译自动评价方法基于N-gram精确率2002年IBM提出目前采用最广泛忽略译文的个性信息词性、连续正确译文长度基于译文加权BLEU改进,二、BLEU方法及分析,二、BLEU方法及分析,1、传统的BLEU方法 基本n-gram精确率公式:,count clip(N-gram)是 匹配的N元短语数;count(N-gram)是译文中N元短语总数。,针对短译文的简短惩罚因子:,c为译文的长度和;r为与每个译文长度最接近的参考译文的长度和,二、BLEU方法及分析,1、传统的BLEU方法引入惩罚因子后,最终的BLEU计算公式如下所示:其中Wn是n元短语的权重,这里通常取Wn=1/N;N是取得最大的n元短语的元数,这里通常取 N=4。这样的BLEU的得分是一个0-1之间的数,较高的得分表示译文质量越高。接近1的得分表示候选译文和参考译文就已经非常接近了。,二、BLEU方法及分析,2、BLEU方法用于汉语译文性能分析数据:某英语水平考试英汉翻译试题1段英文、3个句子1个标准译文+3个手工译文 152篇翻译,阅卷点正式评分满分:12分,各分数段的文件数,二、BLEU方法及分析,2、BLEU方法性能分析各种匹配条件下BLEU-4得分与人工评价得分相关系数,二、BLEU方法及分析,2、BLEU方法性能分析 4个参考译文时与人工评价的相关性较好;按字计算时与人工评价的相关性较好;无论是按字匹配,按词匹配,按词性匹配,还是按词与词性同时匹配的,BLEU的相关性都仅在0.6-07之间,二、BLEU方法及分析,2、BLEU方法性能分析平均对待任何译文不符合人工翻译评价的直觉不区分译文的种类:实词、虚词、还是标点符号 一个正确的名词译文 vs 一个正确介词译文不区分一个正确译文译出和连续多个正确译文 获得连续正确译文的难度要比获得一个正确译文的难度要大对于手工评价,连续正确译文给人重要的正面印象。,三、基于线性回归的BLEU方法改进,三、基于线性回归的BLEU方法改进,1、基于词类的译文权重首先引入词性信息考察不同词性的正确译文和人工翻译评价结果之间的关系各种词性正确译文与人工评价的相关系数(Pearson),三、基于线性回归的BLEU方法改进,1、基于词类的译文权重 回归分析每种词性的权重:引入权重前后BLEU-1得分和人工评分的相关性:,三、基于线性回归的BLEU方法改进,1、基于词类的译文权重对词性加权后,各种情况与人工评价的相关性都相对于BLEU有了很大的提升8种词性计算得分与人的评价得分的相关系数最高:0.77,8种词性的各种组合一元BLEU得分与人工评价得分相关系数,三、基于线性回归的BLEU方法改进,2、N-gram译文分值的计算 将词性权重赋予不同长度的N-gram?在N1时,N-gram会发生2种情况:词与词性完全匹配不完全匹配:词匹配但词性未得到匹配初步分析:仅考虑词与词性完全匹配二元(bigram)的实验,三、基于线性回归的BLEU方法改进,2、N-gram译文分值的计算,BLEU1元和2元是否加权的结果和人工评分的相关性比较,三、基于线性回归的BLEU方法改进,2、N-gram译文分值的计算 在计算N-gram权重应该对所匹配上的词乘以一个权值,考虑到可能由于词性标注误差而造成的不完全匹配对,我们这里做一个近似的处理,将词形匹配而词性不匹配的词的权重乘以一个惩罚因子0.5。3元以及3元以上情况计算方法与此类似。采用这种方法计算的N-gram得分和传统的BLEU得分与人工评价的相关性见下表:,三、基于线性回归的BLEU方法改进,2、N-gram译文分值的计算,增加词性权重进的N-gram得分vs传统BLEU得分,三、基于线性回归的BLEU方法改进,3、N-gram译文分值权重对BLEU1BLEU4分值的权重再次回归分析;根据回归纷纷的权重再计算BLEU-4:加权N-gram得分和人工评分的相关系数:0.780原始BLUE-4:0.620(词和词性)原始BLEU-4最高:0.68(字),四、实验结果与分析,四、实验结果与分析,基于词性和n-gram长度的BLEU方法性能分析 10重交叉交验结果 最高:0.934最低:0.635 平均值:0.782,四、实验结果与分析,机器翻译自动评价性能实验利用互联网上的机器翻译服务,获得12个不同翻译;请同一翻译专家对这12系统译文进行评分;并采用上文152篇数据得到的词性和N-gram的权重;,结语,总结 提出综合加权的BLEU方法,提高了和人工翻译评价的一致性。不同译文词性不同译文长度 在英汉机器翻译结果上的验证了这一方法的性能 后续的工作 测试集独立?机器学习方法?,谢谢!,联系方式:,

    注意事项

    本文(基于译文加权的BLEU改进方法.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开