语料库课件.ppt
《语料库课件.ppt》由会员分享,可在线阅读,更多相关《语料库课件.ppt(104页珍藏版)》请在三一办公上搜索。
1、基于英汉名著语料库的因果关系连词对比研究,一:什么是语料库,A collection of linguistic dataBe stored and accessed electronicallyDesigned and planned for linguistic purposeTexts could be purposively selected and studied both quantitatively and qualitatively,二:语料库的分类,Specialized corpusGeneral corpusComparable corpusParallel corpor
2、alearner corpusPedagogical corpusHistorical/diachronic corpusMonitor corpus,三:什么是语料库翻译学,语料库翻译学是指采用语料库方法,在观察大量翻译事实或翻译现象并进行相关数据统计的基础上,系统分析翻译本质和翻译过程的研究。,四:语料库翻译学的发展,语料库翻译学的发展相当迅速。许多翻译语料库、平行语料库和可比语料库先后建成并投入使用,如:翻译英语语料库(Translation English Corpus)德英文学平行语料库(German-English Parallel Corpus of Literary Texts
3、),欧洲议会口译语料库(European Parliament Interpreting Corpus)通用汉英对比语料库汉英会议口译语料库南京大学英汉名著翻译语料库(NUCECC).?,五:语料库翻译学的特征,1)实证性研究2)自下而上与自上而下方法的结合3)多层次的描写与多视角的解释并重4)定量研究方法的应用,1)实证性研究,实证性研究是指研究者通过对研究对象进行大范围的观察或调查,或采用实验方法获取相关证据或数据,并以此为依据归纳出事物的本质属性和发展规律。语料库翻译学凭借语料库的技术优势,在对大量翻译语料或双语语料进行数据统计和定性分析的基础上,由个别到一般,总结或论证翻译本质和翻译活
4、动的规律性特征。,作为一种新型的语言资源和知识平台,语料库能够提供大量的翻译事实或翻译例证,使研究者很方便地提取研究所需的数据,从而为翻译规律或原则的描写、解释和预测提供远远超过研究者个人认知范围和能力的巨大空间与可能性。这些优势使得语料库翻译学研究具有较强的客观性和科学性。从这个意义上讲,语料库翻译学是一种实证性的译学研究。,2)自下而上与自上而下方法的结合,语料库翻译学研究一般分为:基于语料库的译学研究 研究者依据相关理论提出某一假设,确定具体考察对象,然后观察和分析事先根据某一理论框架进行标注的语料,利用语料库提取的翻译例证和数据,归纳出关于具体翻译事实或现象的一般结论。语料库驱动的译学
5、研究 在不预设任何理论或假设的前提下,使用原始文本或不作任何标注处理的文本,提取高频使用的词汇或句法结构,或者其他特定翻译事实,归纳出某一理论或建构某一理论框架。,从研究路径上看,基于语料库的译学研究表现为自上而下和自下而上方法相结合的特征,而语料库驱动的译学研究主要采用自下而上的方法。自下而上方法是指在分析真实语料和数据统计的基础上,归纳出关于研究的一般结论或抽象理论。自上而下方法,具体表现为首先提出某一理论框架或理论假设,然后根据这一框架或假设确定研究的步骤与方法,依据适当的证据支持或反驳某一理论或假设。,基于语料库的译学研究通常划分为四个步骤:,1)依据某一理论确定利用语料库的切入点,即
6、具体词汇、句法结构或搭配等。之前,根据相关理论和研究目的,对语料进行相关标注;(自上而下)2)提取研究所需的语料和数据,进行数据统计和分析;(自下而上)3)描写数据所反映的总体特征和趋势,归纳出关于某一翻译事实或翻译现象的结论;(自下而上)4)解释有关翻译事实的成因。(自下而上)语料库驱动的译学研究所采取的步骤与基于语料库的译学大体相同,不过没有后者的第一个研究步骤。,3)多层次的描写与多视角的解释并重,语料库翻译学与描写性译学一脉相承,注重翻译事实及其制衡因素的观察与客观描写,因而具有鲜明的描写性特征。 此外,语料库翻译学研究还注重在描写基础上对翻译事实或数据体现的规律性特征进行解释,探索这
7、些规律的前因后果。该区域选取的视角既有语言学视角,也有文化视角和翻译学视角,力求不但让人知其然,而且让人知其所以然,以构建某一理论体系。,4)定量研究方法的应用,定量研究方法是指提取关于研究对象的数据,并对数据进行检验和分析,以测定关于研究对象特征的数值或求出因素间量的变化规律,以获取有意义的结论。定量研究方法通常使用数据、图表或模型等。在语料库翻译学研究中,研究者常常需要提取翻译语料的词汇密度、搭配显著性,以及具体词汇或句法结构的频数等数据,并进行统计和分析,以归纳翻译语言的总体趋势和特征。,定量方法在语料库翻译学研究中的应用具体表现为以下数据的统计和分析:1) 反映翻译文本词汇应用特征和分
8、布的数据:类符/形符比、标准类符/形符比、词汇密度、词表所列的词频、特定词汇的频数和使用频率;2) 体现翻译文本句法特征的数据:平均句长、平均句段长、结构容量、具体句式结构的频数和使用频率;3) 体现搭配显著性的数据:搭配序列频数与节点词频数之比、搭配词的相对频数、Z值、T值和相互信息值或MI值;4) 用于检验相互比较的数据之间差异是否具有显著性的数据:卡方检验和对数似然比。,六:语料库翻译学的研究领域,第一类源自传统译学研究,包括基于语料库的文学翻译、翻译史、翻译教学、翻译实践、机器翻译和口译等领域的研究。第二类研究领域源自描写性译学研究,涵盖翻译共性、翻译规范和批评译学等领域的研究。第三类
9、则为语料库翻译学特有的研究领域,包括译学研究语料库的建设、具体语言对翻译语言特征和译者风格等领域的研究。,七:国外语料库翻译学研究存在的问题,国外语料库翻译学研究取得了可喜的进步,不过仍有较大的上升空间 1) 研究广度较为有限,未能与翻译学的跨学科特性有机结合。国外语料库翻译学研究局限于翻译共性&译者风格和翻译教学等领域的研究,这些研究基本上属于语言学研究范式,从文化层面研究翻译现象和本质的语料库翻译学研究成果寥寥无几。因此,未来语料库翻译学研究既要从语言学视域出发,也要选取文学理论或文化理论视角,从而实现语料库翻译学与翻译学跨学科属性的有机结合。,2) 过分关注翻译语言的共性,忽略翻译语言个
10、性的研究。尽管人类翻译语言和翻译活动存在一定程度的共性,但由于源语和目的语的差异&译者的性别&翻译风格和翻译思想&文本类型&翻译目的和审美标准等因素的影响,具体语言对翻译语言特征和翻译规范表现出不同程度的差异。,( 3) 定量研究处于初级阶段,语料库驱动的译学研究启动定量研究是语料库翻译学区别于传统译学研究的主要特征之一,也是语料库翻译学研究的优势所在。然而,国外语料库翻译学研究所采用的定量研究处于初级阶段,仅仅局限于词频&形符8类符比词汇密度和平均句长等简单的数据分析。这些分析虽然在一定程度上能够揭示翻译规律和译者风格,所发挥的作用却比较有限。事实上,要将定量研究真正引入译学研究领域,未来语
11、料库翻译学研究应运用复杂的定量分析,如卡方检验和统计量测试等,以切实提高译学研究的科学性。,4) 基于语料库的翻译教学研究尚未获得实质性进展现有研究成果只是从理论层面探讨语料库在一些翻译教学环节中的应用,很少有人探讨语料库在翻译教学大纲设计&翻译教材编写以及翻译课堂教学中应用的途径和方法。其次,翻译教学中应用语料库的重要前提是建设翻译教学专用语料库,学界却尚未对此予以关注。因此,翻译教学专用语料库的建设应提上议事日程。这类语料库应根据翻译课程的教学目的和教学内容来设计,应能满足翻译教学的实际需求。,基于英汉名著语料库的因果关系连词对比研究,南京大学 许文胜 张柏然,摘要:本文采用语料库手段,选
12、取两本英美经典小说及译本,参照汉语名著,对其中的因果关系连词进行了定量研究,并在研究结果的基础上分析英汉语句群结构的差异,指出英汉思维模式不同是造成这种差异的深层原因。文章揭示了译本作为独立文本存在的自足性,西化句法存在的合理性、可能性以及翻译中所体现的民族文化心态。关键词:因果关系连词;语料库;对比研究,一.研究背景,20世纪50年代后期发展起来的语料库和语料库语言学研究,被称为结构主义语言学派与功能主义语言学派“两阵对垒的天平上”的一个“举足轻重的珐码”(顾曰国1998:1)。近年来,翻译语料库的研究在国内发展较快,出现了一批有代表性的研究成果(廖七一 2000:380;张美芳 2002:
13、54;王克非2003:410)。,本文以在建南京大学英汉名著翻译语料库(NUCECC)为资源,结合现代汉语小说中抽样文本特点,探讨傲慢与偏见、最后的莫希干人2本小说英语文本和汉语译本中的因果关系连词对比; ?在此基础上揭示语料库研究在译学研究中拓展的新视野。,二.本项研究理论基础,英汉语言的最大差异在句法结构上表现为: 英语句式注重形合,较多包孕结构,其分句之间更多依赖连接词的观照; 汉语则偏重意合,仰仗意气统制,分句之间少用或不用关联词语。,英语中因果关系的标记,词汇 cause, because, result in, arise from, thanks to,give rise to,
14、 so, since, therefore句法结构 短语 : Because of the rain , the game was canceled. 从句 : I went to the museum because I had a couple of hours to spare.句子的含义 In I985 the use of poisoned bait was introduced to control rats. By I990 there were reduced numbers of several bird species.,奥登博格指出,尽管英语中表达因果关系可供选择的方式多
15、样,但很少能自由取舍,而是随语义、语用、文体、认知、文本的变化不同。,奥登博格研究了伦敦一朗德语料库(LLC)中10万词自然英语会话和相同规模LOB语料库中资料性散文体明确因果关系标记。他主要关注的是通过句法表达的因果关系,特别是四种主要方式,即 副词连接(如hence, so), 介词连接(如because of), 从属关系(如because,since) 从句结构(如thats why )。,在确定的98个类型中,在LOB中出现82个,而LLC中出现52个。奥登博格发现,在四种表示因果关系的结构中,每个语料库中从属结构占了约一半,而副词连接约占三分之一(Altenberg 1984:20
16、 -69) 。,以下表格中显示了两个语料库中15个最常见的因果关系连接手段。某些手段出现非常频繁(如because,so),有些连接手段则在总共20万字库中仅出现一两次(如as a consequence, accordingly),另一些连词(on account of, by reason of)则在语料库中根本没有出现。,作为两种最为常见的手段,because和so在LLC语料库中占74 % ,而在LOB中仅占19 %。奥登博格指出,这一区别具有明显的文体结构差异,笔语语料库中文体变化更多,“而主要是非公开、亲密的、个人的口语场景,因为没有提前计划,语言随便,较少关注文体变化”。(Alt
17、enherg 1384 ; 39),在奥登博格调查的LLC和LOB两个语料库的样本中,先果后因(RC)略占优势,为54%。然而,他的研究表明,某些因果手段常常和口语或书面语中因果信息表达相关联。比如,口语文本中,so通常用于先因后果中,而because则用于先果后因。这一点,在Fang和Kennedy研究中也得到验证。他们发现,在整个LOB语料库中,以because引导的从句中,只有6%位于句首。,Fang和Kennedy选定130多种表示因果关系的连接词,发现LOB语料库中5 , 862例句涵盖了其中119种表达方式。尽管他们增加了诸如effect, cause, reason等名词或动词类
18、型,其排序无法同奥登博格的结论进行简单类比,但在这一大得多的笔语语料库中,占主导地位的连接词,如because, so, for, therefore, since, so that等,则相当接近。最常见的23种类型,占语料库中所选5, 862例句的82%( Fang,X. and Kennedy,G. 1992;60一80)。,三、英汉因果连词的对比分析,1 汉语因果连词统计 a.英语语言特点:屈折语,借助屈折形式表达不同的语法意义。 b.英语因果关系表达实现手段:词汇手段,语法手段,逻辑手段。 c.英语句式特点:以动词为中心,焦点式构造,通过严格的词性变化和关系词语表明中心语与关联成分的关
19、系。句子结构向心收束,空间架叠繁复紧凑。 因此,句法关系明确,成分位置灵活,表达严谨缜密。,a.汉语语言特点:孤立语,表达多赖上下文的自然顺序,以动词或句读的散点铺排追随文思事理。 b.语言形式:以意合的凝练灵活,文气的流畅充盈为内在精神,以排偶或排偶与散句的交错为形式,句读简短,整齐和谐,次序谨然,气韵流动。 c.语法关系主要通过词序体现,注重运用语义达到连贯目的。只要不影响意义的表达,分句间的连接词常常可以省略。汉语因果关系句群常体现一种很强的句际逻辑关系。,目的:分析若干汉语小说名著中主要因果关系承递词的使用情况语料库:南京大学英汉名著语料库方法:抽取样本调查,2.英汉因果连词的对比分析
20、,对比对象:上述汉语因果连词的统计结果,英语小说原文及汉语翻译文本目的:就其中因果关系连词的使用情况进行对比分析,探明译语的语言和文学系统规范的使用情况,从而判断译文是否为完全的“充分翻译”或完全的“可接受的翻译”。方法:分别从英美小说中各选取一篇傲慢与偏见和最后的莫希干人的英语及汉译文本。,参照Altenberg和Fanp(对于表1,2中出现的 so. that”结构,作者认为,就语法关系而言,它们更多是引导目的或结果状语从句,其汉语译文极少采用因果关系连词)汉语文本则讨论了“因为、所以、由于、既然、因此、因而”等6个因果连词。,2.1英语小说因果连词统计,通过Wordsmith对标注的Pr
21、ide and Prejudice和The Last of the Mohicans进行分析,得出两本小说中因果关系连词的分布情况,如下表所示:,2.2汉语译本的因果连词统计,利用concapp分析工具 应用语言学研究即有理论研究,也有实证研究。理论研究在于提出、发展与建立应用语言学的理论体系,包括术语体系、分类体系与概括性话语体系。实证研究是基于数据的探索过程,包括数据收集、数据检索、数据加工、数据分析和数据解释。数据可以是文字资料,也可以是数字资料。数据可以是来自一个或几个案例的资料,也可以是来自大量案例的资料。,应用语言学研究工具指那些用于数据收集、数据检索、数据加工、数据分析的制品,包
22、括纸质品、软件和设备。因而,应用语言学研究工具可以分为数据收集工具、数据检索工具、数据加工工具、数据分析工具。 数据收集工具主要用于收集原始的或一手的文字与数字资料。这类工具包括测试卷、问卷、眼动仪、脑电仪(ERP)、键击记录(Keystroke Inputlog)等。 数据检索工具主要用于对原始数据中的某些特征的提取。这类工具包括Antconc、ConcAPP、Hyconc、Monoconc、Wordsmith等。,数据加工工具这里指对原始文字数据进行附码的一些软件,如TAGGER、CLAWS、ICTCLAS等。 数据分析工具可以分为两种,一种是语料描述统计分析软件,一种是概率统计分析软件。
23、语料描述统计分析软件可以对语料做一些描述分析,包括频数分析、频率分析、均值与标准差分析等。这种软件的例子有Excel、Range、Wordsmith;Cohmetrix。概率统计分析软件则是在描述统计的基础上,运用概率理论,根据特定的研究假设,对数字数据进行检验分析。我们熟悉的统计软件包括SPSS、SAS、STATA、MATLAB等,还有LISREL和AMOS等高级建模统计分析软件。,利用concapp分析工具,我们得出了傲慢与偏见和最后的莫希干人两部汉语译著中因果关系连词分析表。为便于对照,我们采用了每万句和每万字(词)中因果关系连词数目作为参数,其结果如下表所示。,通过上述两部英语名著及其
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语料库 课件
链接地址:https://www.31ppt.com/p-1596903.html