大学实用翻译教程(英汉双向)第三章计算机辅助翻译ppt课件.ppt
《大学实用翻译教程(英汉双向)第三章计算机辅助翻译ppt课件.ppt》由会员分享,可在线阅读,更多相关《大学实用翻译教程(英汉双向)第三章计算机辅助翻译ppt课件.ppt(36页珍藏版)》请在三一办公上搜索。
1、第三章 计算机辅助翻译,有史以来,人类对翻译方法的探求就不曾停止过。随着世界各国商贸、政治往来越来越频繁,经济全球化越来越迅速,对于翻译的需求量越来越大,人们对于更加快捷、更加简便的翻译方式的渴求也越来越强烈。电子计算机的出现,使人类的生活发生了翻天覆地的变化,通过网络,一方屏幕之间可以承载远隔千山万水的信息交流与传递,其高效的信息处理模式也给传统的人工翻译变革带来了新的曙光。可以说,计算机和翻译一样都是为了打破人们交流的障碍,重建属于世界的“巴别塔”,那么,将计算机技术与翻译相结合,产生的新兴课题“计算机辅助翻译”究竟是什么呢?本章将对机器翻译和计算机辅助翻译的发展历程进行回顾并展望其未来的
2、发展前景,并且介绍几款主流软件和翻译工具的使用,详解如何利用搜素引擎和最大化地利用在线翻译,让读者对于计算机辅助翻译有一个较为清晰和全面的了解。,第一节 计算机辅助翻译的“前世今生”与前景展望,“计算机辅助翻译”这个概念从更早的“机器翻译”发展而来,经历了漫长的发展历程,伴随着人们认识的深入和实践的丰富,其内涵不断地得到扩充,应用范围也在不断地扩展和延伸,这一节将详解计算机辅助翻译的“前世今生”,并展望其未来发展的趋势和远景。,1.1计算机辅助翻译的发展历程,“机器翻译”的概念可以追溯到20世纪30年代,40-50年代初经历了早期的尝试阶段,当时,大多数从事手工翻译人士对于“利用计算机进行翻译
3、”不以为然,他们根本就不相信翻译会机械化,少数人则或多或少有一点担心,害怕有一天机器会把他们取而代之。5060年代中期学界对于“机器翻译”持高度乐观的态度。Systran翻译软件将“机器翻译”定义为利用计算机软件把文本内容从一种自然语言转换成另一种自然语言,这个定义就是说“机器翻译”是利用语言结构、规律和把原文(the source language)的语言结构转换成译文(the target language)的语言结构。“机器翻译”这一想法产生的时间正是结构主义语言学的观点盛行时期。由于人类对语言结构规律的研究越发深入,语言学家为翻译找到了更多的理论依据作为支撑,从而给翻译加上了科学主义的
4、色彩。奈达、巴尔胡达罗夫以及彼得纽马克等人的翻译观都是从结构主义理论开始的。(张治中,俞可怀,2002:54-58)结构主义者认为在各种复杂的表面现象的下都有着一种普遍性的规律,这些规律就是结构,人们通过分割归并作品的各种结构就可弄清语言信息变成文艺作品的奥秘。(吕俊, 2001:96-111),1966年美国的ALPAC(The Automatic Language Processing Advisory Committee)报告对机器翻译的研究和应用开发是一次沉重的打击,也是研究方向的转折点。经过十年左右的沉寂和停滞,70年代后期,研究和开发有了复兴。70年代出现、80年代形成的认知语言学
5、认为:人在形成有意义的概念及进行推理的过程中,人类的生理结构、身体经验以及人类丰富的想象力发挥了重要的作用;任何语言形式本身没有意义,它们只作为线索激活我们脑中已经存在的意义身体经验,并依据自身体验而有意义。翻译正是一项以人为主体的跨语际交际活动,只有人这个主体才能胜任,人类在其所处的社会群体中发生的交际活动是以社会环境和知识背景为基础的。而相比之下,计算机没有感情,没有对生命的理解和体验,仅仅依靠单一的逻辑,即使计算再精确也无法完成复杂的人类交际活动。,到了20世纪80年代,“机器翻译”的提法和研究进入了反思的理性阶段,其标志是开始有人质疑“机器翻译”这一概念,提出了我们必须区分以下三种概念
6、:(1)机器翻译(machine translation):全部翻译由机器完成,但是其结果必须经人工修订;(2)辅助手段(computer aids for translators):翻译活动由人工进行,机器翻译只是作为人们翻译时使用的辅助工具; (3)非翻译人员为获取梗概大意偶尔使用的机器翻译系统(translation systems for the “occasional” non-translator user).(Hutchins, 2001)John Hutchins等人提出了“机器翻译”的提法不合适,应该是机器辅助翻译。时至今日,计算机人性化尚不能实现,即使随着科技的进步,计算机
7、已经学会记忆并具备学习功能有些辅助翻译软件具备简单的学习记忆功能(例如,我国北京实达的“雅信”翻译软件),但是仍然无法突破不会思维的障碍,不可能翻译出与人工翻译相媲美的译文来。况且计算机对于新兴的、或者特殊的表达形式根本就不会处理,根本不会“翻译”,直接导致了它学习、记忆的步伐永远落后于时代的进步。要获得地道的完整的译文必须要经过人工修改、加工。,80年代后期到90年代早期出现了新的转折点,“机器翻译”研究开始从纯理论研究转向实际应用,计算机科学的发展和计算机语言学的发展,使人们对计算机在辅助翻译方面抱有很大希望。从上面列举Systran系统翻译的例子我们可以看出,词的这一层次的转换准确率高达
8、95%以上。如果作为辅助翻译,该系统是很有效的。值得注意的是,人与计算机在处理要翻译的材料时的速度差别甚大。以Systran翻译系统为例,它每秒可处理3700字,而人工翻译每天只能翻译2000-3000字。(张治中,俞可怀,2002:54-58)由于互联网发展神速,要翻译的多种语言的信息,远远超过人工翻译的承受能力。让我们不得不思考“机器翻译”与“人工翻译”究竟该如何选择的问题,其实二者并不矛盾,而且可以相辅相成、互补不足,在这个信息爆炸的时代,机译可以帮助我们收集只需梗概大意的信息,而人译则能使这些信息合理组合,获得极高的可读性,它们的结合便产生了“计算机辅助翻译”。这一概念逐渐为人接受,研
9、发者着手为职业译者提供译者工作台(translator workstation),在受控语言和受限专业系统方面进行开发,并探讨在多语信息系统里如何应用翻译组件。,1.2计算机辅助翻译的发展前景展望,根据前面对机器翻译的介绍可以看出,自然语言的复杂性决定了机器翻译技术发展的困难性。计算机语言学家提出了各种各样的机器翻译理论,但目前为止还没有哪种理论能够有效的解决所有问题。但是,机器翻译系统的应用领域正在发生变化。人们正在尝试将机译技术结合到信息访问、信息提取和自动文摘中。这类跨语言应用在全球范围内越来越引起人们的兴趣。未来对于口语的翻译也是市场迫切需求的,但尽管基于某些方面的需求,机器翻译的发展
10、方向更加多元化,但无论从实际应用角度还是从理论研究角度来看,全自动的话语翻译还是很难实现的。当然,虽然机器翻译的发展有诸多阻碍,但仍然有更多的发展希望。目前,单语语料库加工技术以及应用在计算语言学领域内取得的成功,使建立双语或多语语料库并进行多层次的加工作为大规模的跨语言资源成为研究的焦点之一。另外,大规模的语料库适合于统计方法的应用,通过统计来自动进行知识获取,有助于克服自然语言处理中知识获取的瓶颈。把机器学习方法应用到机器翻译中,可以帮众系统实现在线学习功能,最终建立主动的智能翻译服务也是机器翻译的发展方向之一。,在全自动翻译的质量尚不能满足要求的情况下,计算机辅助翻译系统和软件的开发是机
11、器翻译的突破性发展。计算机辅助翻译为译员提供一个半自动的工作环境,帮助译者提高工作效率的同时,更能保证翻译的质量。然而,目前的计算机辅助翻译技术大多是以句子为单位的,在未来的发展中,应该更加注意语境因素,将范围扩大到语篇,这将使翻译结果更为准确。另外,目前使用计算机辅助翻译软件的团体或个人往往不愿意将资源共享的情况,应努力改善这种状况,建立更多如中国知网一样的共享数据库。如果译员使用一个大型的共享翻译记忆库就能将重复的翻译劳动降至最少,并帮助解决语义的理解分析问题。与机器翻译一样,现在还没有能够进行口语翻译的计算机辅助翻译系统或软件出现,这也是机辅翻译的一个重点发展方向。除此之外,能够开发出操
12、作更加简便、性价比更高的机辅翻译软件更是市场的迫切需求。(董晓波等,2011:328)在过去的几十年里,信息技术翻译手段在曲折中前进。到如今,计算机翻译技术发展迅猛,展望未来,计算机辅助翻译发展前景广阔,无论是机器辅助人的翻译软件(MAHTMachine Aided Human Translation,近来我们称之为CATComputer Aided Translation),还是人辅助机器的翻译软件(HAMTHuman Aided Machine Translation),将来都有其可用武之地,因此,开发出实用的、能满足使用者需要的翻译软件一直是研究者、研发人员们所探索的未来发展之路。,第二
13、节 计算机辅助翻译的原理,计算机辅助翻译是语言学,数学,计算技术和自动化技术等学科部门结合的产物,但归根到底是个语言学问题(刘涌泉,1997:79-82)。早期的系统基本由双语辞典构成,一个源语词汇对应一个或多个目标语词汇,再配备有产出正确句序目标语的语法规则。但很快人们就意识到,仅靠词汇和词序是很不够的,还需要更为系统的句法分析。当时盛行的形式语法似乎能为此寻找一条出路。但随后,研究者又陷入机器在语义理解上的困境。80年代,机器翻译系统的主导策略是通过中间表述(intermediary representations)实现的间接翻译(indirect translation),过程涉及到语义
14、、句法、词法层次的分析,有时伴有非语言的知识库。80年代末,IBM研究组公布了他们完全基于统计方法的机器翻译系统(Candide)的成果;一些日本研究组开始利用翻译语料的方法,这种方法后来被称为“基于例句”的翻译。与此前“基于规则”的翻译系统不同,这两种的特点都是不再利用句法或语义规则来分析文本或选择对等词汇,而是利用了大规模的文本语料,翻译模块混合了基于规则和基于语料的方法。,这个时期,几乎所有的研究活动都致力于在传统的基于规则和“中间语言”模式的基础上进行语言分析和生成方法的探索。这些方法都伴有人工智能类型的知识库,表现了更具创新性的潮流。译员的需要让位于商业兴趣:术语管理软件出现,如Me
15、rcury/Termex。ALPNET在80年代上市了一系列翻译工具,其中还包括“翻译记忆库”(Translation Memory,TM)的早期版本,即将事先翻译好的双语文本对齐后形成的数据库。90年代早期,机器翻译研究被新兴的基于语料库的方法向前推进,比如统计方法的引人(如IBM公司的Candide计划),以及基于实例的机器翻译等。统计技术为先前基于规则的方法带来了解放。消除歧义问题,代词指代以及更多的惯用法生成等问题,都因为基于语料库技术的应用而有了解决的希望。统计方法跟基于规则的方法一样也不能提供更多让人满意的答案,但是跟10年前相比,现在提高输出译文质量的希望似乎更大了,最有前途的方
16、法可能是前文提及的整合了基于规则和基于语料库的方法。现在许多商用机器翻译系统正在集成翻译记忆库,而许多翻译记忆库又被机器翻译方法加强。(钱多秀,2009:49-54),第三节 主流软件的介绍及使用,3.1 TRADOSTrados于1984年由德国工程师约亨胡梅尔(Jochen Hummel)和希科克尼普豪森(Iko Knyphausen)开发,在德国斯图加特成立了Trados公司。应该被称为是计算机辅助翻译软件的鼻祖,号称“翻译软件中的DOS”,SDL Trados是目前国际最流行的计算机辅助翻译软件,在全球已经拥有20多万用户,全球500强企业中有超过90%的公司都在使用SDL Trado
17、s辅助日常的本地化翻译工作。使用SDL Trados,用户通常能够将完成工作的速度提高50%左右,并可以显著减少翻译错误。除此之外,SDL Trados还设有专门的术语库,可以使文本中出现的相同术语翻译统一,使译文显得更为精准、工整、专业,这一点对科技、法律、医学等方面的翻译都尤为重要。(董晓波等,2011:303),Trados的精髓在于创立了翻译记忆体的概念,即TM(Trans-lationMemory)。作为众多国外计算机辅助翻译系统中的典型代表。Trados首创“翻译记忆”这个概念并且成功的使其实现了商品化。所谓TM,就是译员在每次翻译中对词语,句子,结构等翻译会被软件关注吸收并添加到
18、TM中,当在以后的翻译工作中遇到同样或者类似的段落,机器便自动提示如何翻译。译员只要选择自己认为正确的译文即可。因为大量的重复翻译存在科技翻译、文献翻译、非文学翻译中,这样就可以提高翻译的准确率和效率。翻译的质量取决于其后台TM的质量,TM可以由译员一个人来构建,也可以由众多的译员来构建,而按照计算机辅助翻译软件的机制,此种TM是可以单独的,也可以在机器与机器之间,软件与软件之间进行共享。通过各种渠道得到不同专业背景的术语从而丰富本地机器的语料库,这样的共享使得译员对陌生领域的翻译更加顺畅,精准。(薛文枫,2008:57)目前该软件的技术也相当成熟,拥有非常高的市场占有率。TRADOS公司的最
19、新版本TRADOS 5包含多个模块,每个模块各司其责,例如:工作空间(WorkSpace);翻译者工作台 (Translator s Workbench);术语管理(MultiTerm);术语抽取(ExtraTerm);匹配建库(WinAlign);标记格式编辑器(TagEditor)) 等。但是由于多模块设计等原因,Trados可能是翻译记忆软件中最难于掌握的软件之一。用户必须经历长时间的学习,才能真正完成从建立翻译到进行翻译,最后翻译成品的过程。,3.2 DjVuDjVu是Atril Language Engineering公司开发的翻译记忆系统,是翻译记忆软件中的后起之秀。虽然现在没有很
20、高的市场占有率。但它是一个很棒的系统,越来越多的用户开始认识到这款软件的优越之处。DjVu的界面清晰简明,可以将文件浏览、自动术语和翻译记忆搜索等功能集中在一个统一的界面中,也可以选择把其中的某个功能区窗口拖动到主窗口之外。操作简便,界面整齐条理,最大的亮点就是可以选择固定编辑行的位置,这样,当你完成一句翻译并确定后,下一句会自动递补到当前位置,像这样的灵活的调节设置,在其他的计算机翻译辅助软件中是不常见的。(徐彬,郭红梅,国晓立,2007:82-85),3.3东方雅信CAT东方雅信CAT是国内最为人们所熟知的计算机辅助翻译软件,应用广泛,在国内居领先地位。雅信CAT由北京东方雅信软件技术有限
21、公司研发,于1999年首次面世,同样是采用了翻译记忆技术和灵活的人机交互技术,经过多年的技术积累,目前已升级到“雅信CAT4.0”版本。雅信CAT提倡让人和计算机进行优势互补,由译员把握翻译质量,计算机提供辅助,节省译员查字典和录入的时间,系统还具有自学功能,通过翻译记忆不断积累语料,降低劳动强度,避免重复翻译。不仅可以大幅提高翻译效率、节省翻译费用、保证译文质量。雅信CAT在能够保证良好的帮助译员优质、高效、轻松的完成翻译工作的同时,所需费用还比西方研发出的机辅翻译软件要少。,雅信CAT除辅助翻译功能以外,还具有其他多种功能帮助实现和完善机辅翻译。重要的有:(1)库维护,是对用户积累的资源进
22、行集中管理,可增加、删除和修改其中的内容,使其更精确、更实用。库维护分别针对词库和记忆库进行管理。(2)项目管理,是对翻译项目进行科学管理的工具,可以提供待翻译文本的统计数据,保证译文质量和术语统一。也就是说在翻译前,译员可以先使用项目分析功能,对待翻译文本进行分析,从记忆库中提取待翻译文本可以参考的词库、记忆库,并且产生分析结果,主要包括待翻译项目的工作量和记忆库中可直接利用的句子数量,以及文本中高频出现的词汇、短语或句子,可以统一处理,简化项目的组织和管理。(3)快速建库,对于以前翻译的历史资料,可以利用快速建库功能直接添加为记忆库,以便在翻译时参考使用。这样,对于刚开始使用该系统的用户来
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学 实用 翻译 教程 英汉 双向 第三 计算机辅助 ppt 课件
链接地址:https://www.31ppt.com/p-1640484.html