神经机器翻译前沿进展课件.pptx
《神经机器翻译前沿进展课件.pptx》由会员分享,可在线阅读,更多相关《神经机器翻译前沿进展课件.pptx(36页珍藏版)》请在三一办公上搜索。
1、神经机器翻译前沿进展,机器翻译,目标:利用计算机实现自然语言的自动翻译,2,布什,与,沙龙,举行,了,会谈,Bush,held,a,talk,with,Sharon,发展历史,趋势:让机器更“自主”地学习如何翻译,3,规则机器翻译,统计机器翻译,神经机器翻译,1980,1990,2013,数据驱动机器翻译1990,数据驱动的机器翻译,核心问题:如何为翻译过程建立概率模型?,4,布什,与,沙龙,举行,了,会谈,Bush,held,a,talk,with,Sharon,统计机器翻译,隐变量对数线性模型:在隐式语言结构上设计特征,5,布什,与,沙龙,举行,了,会谈,Bush,held,a,talk,
2、with,Sharon,(Och and Ney, 2002),基于短语的统计机器翻译,短语翻译模型:以隐结构短语为基本翻译单元,6,布什,与,沙龙,举行,了,会谈,(Koehn et al., 2003),统计机器翻译的优缺点,优点隐结构可解释性高利用局部特征和动态规划处理指数级结构空间缺点线性模型难以处理高维空间中线性不可分的情况需要人类专家设计隐式结构及相应的翻译过程需要人类专家设计特征离散表示带来严重的数据稀疏问题难以处理长距离依赖,7,难点:长距离调序,8,Bush,President,held,a,talk,with,Israeli,Prime,Minister,Sharon,at
3、,the,White,House,如何用上述词语拼成合理的译文?,统计机器翻译示例,9,深度学习带来新思路,10,Yann LeCun,Yoshua Bengio,Geoffrey Hinton,(LeCun et al, 2015),机器翻译方法对比,11,英国爱丁堡大学在WMT英德评测数据上的BLEU值。NMT 2015年结果来自蒙特利尔大学。来源:Rico Sennrich报告和斯坦福ACL 2016 Tutorial。,神经机器翻译,利用神经网络实现自然语言的映射,12,布什,与,沙龙,举行,了,会谈,Bush,held,a,talk,with,Sharon,(Sutskever et
4、 al, 2014),编码器-解码器框架,利用递归神经网络实现源语言的编码和目标语言的解码,13,布什,与,沙龙,举行,了,会谈,Bush,held,a,talk,with,Sharon,(Sutskever et al., 2014),递归神经网络的优缺点,优点适合处理变长线性序列理论上能够利用无限长的历史信息缺点“梯度消失”或“梯度爆炸”,14,(Pascanu et al., 2013),长短时记忆,通过门阀技术缓解“梯度消失”和“梯度爆炸”,15,(Hochreiter and Schmidhuber, 1997),神经网络学到了什么?,16,(Sutskever et al., 20
5、14),编码器-解码器架构的优缺点,优点:利用长短时记忆处理长距离依赖缺点:任意长度的句子都编码为固定维度的向量,17,(Sutskever et al., 2014),基于注意力的神经机器翻译,利用注意力机制动态计算源语言端相关上下文,18,(Bahdanau et al., 2015),布什,与,沙龙,举行,了,会谈,Bush,held,a,talk,with,Sharon,注意力,思想:集中关注影响当前词的上下文,19,(Cheng et al., 2016a),神经机器翻译中的注意力,源语言词语目标语言词的关联强度,20,(Bahdanau et al., 2015; Cheng et
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 神经 机器翻译 前沿 进展 课件

链接地址:https://www.31ppt.com/p-1484012.html