融入句型信息的汉英双向调序模型.ppt
《融入句型信息的汉英双向调序模型.ppt》由会员分享,可在线阅读,更多相关《融入句型信息的汉英双向调序模型.ppt(26页珍藏版)》请在三一办公上搜索。
1、1,融入句型信息的汉英双向调序模型,张家俊、宗成庆 中科院自动化所 2008.11.28,2,背景,自从IBM翻译模型的提取,特别是基于短语的翻译模型提出后,调序模型始终是统计机器翻译的关键问题,是研究的热点从基于距离的扭曲模型、词汇化的调序模型到层次化的短语翻译模型、最大熵调序模型,都非常有效地提高了翻译质量,3,想法,这些模型没有充分利用语言所固有的语法信息,在不需要调序的地方浪费了大量的计算时间这些模型没有充分利用句子的先验知识,譬如句型,因为不同的句型具有不同的调序策略,4,句型在调序中的作用,几个例子:,5,句型调序分析,特殊疑问句中至少有一固定的短语(我们称为特殊疑问短语)在翻译成
2、英语时通常出现在句首;一般疑问句在翻译时有特定的例如can,do,is等引导词;在非疑问句中,有很大比例的句子中出现介词短语、时间地点短语,这些短语在汉语中出现在动词前,而在翻译时一般出现在动词的后面,6,口语语料分析,我们分析277k 中英对齐句对发现,大约 17.2%是特殊疑问句,约 25.5%为一般疑问句,其余为非疑问句。可见在口语翻译中,基于句型的调序是非常有意义且具有研究价值的,7,基于句型调序的翻译框架(汉英),C1:特殊疑问句,C2:一般疑问句,C3:非疑问句,8,基于句型调序的翻译框架(英汉),C1、C2和C3的意义同上图,“逆”表示与上图的算法相似但调序方向相反,9,模型与算
3、法,句型的分类算法:SVM-based前向调序模型、逆前向调序模型后向调序算法、逆后向调序模型,10,句型分类算法,SVM的优势,分类准确,几乎不受标点的影响(我们知道标点是句型关键性的特征)实验:语料:三类句型分别问1000句,80%作为训练,20%作为测试实验结果:,11,前向调序模型,适用句型:特殊疑问句调序对象:特殊疑问短语调序的两个关键问题:特殊疑问短语的识别正确的调序位置,12,调序的两个关键问题,特殊疑问短语的识别我们在语法上给特殊疑问短语一个定义:包含特殊疑问词的完整的语法成分。特殊疑问词是利用互信息得到的一个闭集:什么、哪、多(多长、多久)、怎、谁、几、为什么、何在汉语中,从
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 融入 句型 信息 汉英 双向 模型
链接地址:https://www.31ppt.com/p-5405190.html