语料库资源与汉语教学研究.ppt
语料库资源与汉语教学研究,郑艳群2009年2月16日,从傻瓜相机说起,需要 技术 成本 普及 必须,现代汉语语料库样例,汉语中介语语料库样例,例1:正在看这个【多么】好美丽啊的建筑。例2:这些三十年经过了【真】很快啊!例3:中国的万里长城也是在世界上【最】很有名的一个地方。例4:我【很】特别喜欢小妹妹。例5:可是很多人知道在原子核的电能量生产用的燃料几年 以后【很】非常危险!,偏误类型-“程度副词连用”,应用语言学狭义:第二语言教学广义:语言应用的各个方面,范围是开放的。,计算语言学是利用计算机研究和处理自然语言的新兴学科,是应用语言学的重要组成部分。,计算机与语言文字工作的结合,产生了计算语言学。从语文界的角度来看,这是一个新的应用领域。,用计算机进行语言处理,要求我们彻底从事实出发,而不是从观念出发。这实际上是对各种语法理论的一种严峻考验。,计算语言学还可以分为:计算语音学:语音识别计算词汇学:词汇库、术语库等机器可读词典(叫电子词典)计算语法学:用计算机分析自然语言的语法,自动语法分析计算语义学:利用计算机分析自然语言的语义语料库语言学,任何一种语言的语料几乎都是无限的。抽样存入计算机,作为其全部语料的代表而进行统计分析。,在科技发达的国家里,大多数科技信息都将储存在计算机里。如果语言学家不能及时转变到在计算机上处理语料,他就将失去自己研究的主要对象,失去获取知识的来源。,语料库应用:基于大规模语料库的语音识别;基于大规模语料库的音字转换技术(中文输入);基于大规模语料库的自动文本校对技术;利用语料库训练词性标注模型(分词、词性标注、词义标注);基于语料库的句法分析;基于语料库的机器翻译;(平行语料库)基于机器学习技术:获取语言知识(搭配特征/句法规则);基于语料库的语言模型训练以及语言模型的评价。,俞(99),在发现和积累更多语言知识的过程中,语料库起着举足轻重的作用。,随着计算语言学研究内容不断丰富,应用系统日益走向成熟,语料库在自然语言处理研究中的重要意义也越来越多地被人们所认识。,1语言习得(观察材料)2方言学(运用直接法所获得的不同分布的语言事实来绘制方言地图。资料积累-编撰整理)3语言教学(使用语料研究外语教学法。词汇表的选定,控制学习过程)4句法和语义(利用语料库研究语言的描述)5音系研究(利用自然语料开展音系研究。强调获取自然语料和语料分析的客观性),黄(3),把计算机作为一种工具引入语言学研究,这是值得重视的一个动态。(马),把语料库作为一种资源引入汉语教学研究,这也是值得重视的一个方法或手段。(郑),语感证据经验实证主观客观规则统计,课程内容:一、文献学习二、实际操作三、自行设计四、讨论,考核方式:一、平时作业(60%)二、课堂讨论(20%)三、学期作业(20%),基础和背景要求、预期目的:不在于是否有相关知识背景、计算机基础,而在于你是否有兴趣、有热情;不在于学到多少知识、技巧,而在于学到方法、过程;,参考资料:黄昌宁等著语料库语言学,商务印书馆,2002年。冯志伟著计算语言学基础,商务印书馆,2001年。俞士汶主编计算语言学概论,商务印书馆,2004年。赵金铭等著基于中介语语料库的汉语句法研究,北京大学出版社,2008年。张博等著基于中介语语料库的汉语词汇专题研究,北京大学出版社,2008年。其他资料。,