概述语言信息处理自然语言理解.ppt
《概述语言信息处理自然语言理解.ppt》由会员分享,可在线阅读,更多相关《概述语言信息处理自然语言理解.ppt(41页珍藏版)》请在三一办公上搜索。
1、概述(语言信息处理&自然语言理解),2009-2010学年For 对外汉语方向本科生,对外经贸大学中文学院.对外汉语,甲:听说吴妈打赢了阿Q。乙:不错,阿Q确实被吴妈打败了。甲:这个结果有些出人意料。乙:阿Q是大意失荆州,怪不得别人。,昆仑军分区歌舞团长途跋涉来我部慰问演出,这像是方红画的,人用来交际的“语言”具有什么样的性质?人用来交际的“语言”和机器可以理解的语言有什么样的关系?人是如何运用“语言”进行交际的?人运用“语言”进行交际的“过程”是否可以描述为一个“机械的过程”?什么叫做“理解”一种语言?如何从“内在的交际意图”到“外显的语言表达”?,对外经贸大学中文学院.对外汉语,释名,自然
2、语言(Natural Language)一种语言,其规则是根据当前流行的用法而不是用明确的形式规定的。自然语言是没有经过加工的或人为干预的语言。人造语言(Ruled language)一种语言,其规则在使用前已经明确地规定了。是一种由人为某些特定目的而创造的语言。语言信息处理自然语言理解自然语言处理人类语言技术计算语言学,对外经贸大学中文学院.对外汉语,释名,计算语言学(Computational Linguistics)计算语言学是利用电子数字计算机进行的语言分析。虽然许多其他类型的语言分析也可以运用计算机,计算分析最常用于处理基本的语言数据例如建立语音、词、词元素的搭配以及统计它们的频率。
3、(大不列颠百科全书),计算语言学指的是这样一门学科,它通过建立形式化的数学模型来分析、处理自然语言,并在计算机上用程序来实现分析和处理的过程,从而达到以机器来模拟人的全部或者部分语言能力的目的。,人类语言技术(Human Language Technology,HLT)所有围绕人类语言(而非动物语言或形式语言)所开展的处理技术的研究。,对外经贸大学中文学院.对外汉语,释名,自然语言理解(Natural Language Understanding,NLU)人工智能的分支学科。研究用电子计算机模拟人的语言交际过程,使计算机能理解和运用人类社会的自然语言如汉语、英语等,实现人机之间的自然语言通信,
4、以代替人的部分脑力劳动,包括查询资料、解答问题、摘录文献、汇编资料以及一切有关自然语言信息的加工处理。,自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。实现人机间自然语言通信意味着要使计算机既能理解自然语言文本的意义,也能以自然语言文本来表达给定的意图、思想等。前者称为自然语言理解,后者称为自然语言生成。,对外经贸大学中文学院.对外汉语,释名,语言信息处理(Language Information Processing,LIP)是指用计算机对自然语言的
5、音、形、义等信息进行处理。即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作与加工。语言信息处理是一门边缘学科,也是一门交叉学科。它综合了语言学、逻辑学、心理语言学、计算机科学、哲学、人工智能、数学和统计学的研究成果,将它们运用于计算机的语言分析和处理。,对外经贸大学中文学院.对外汉语,参考文献,自然语言的计算机处理 冯志伟 上海外语教育出版社应用语言学 刘涌泉 湖南教育出版社汉语计算语言学 吴蔚天 罗建林 电子工业出版社人工智能原理 石纯一 清华大学出版社现代汉语语法信息详解词典 俞士汶 清华大学出版社自然语言理解 姚天顺 清华大学出版社信息处理用现代汉语分词规范及自动分词方法
6、 刘源等,清华大学出版社计算语言学概论 翁富良等 中国社会科学出版社当代西方语法理论 俞如珍 上海外语教育出版社语言文字应用,1992年至今各期,对外经贸大学中文学院.对外汉语,中文信息处理,傅永和,广东教育出版社应用语言学综论,冯志伟,广东教育出版社语料库语言学,黄昌宁,商务印书馆计算语言学探索,冯志伟,黑龙江教育出版社计算语言学基础,刘颖,清华大学出版社计算语言概论,俞士汶主编,商务印书馆语言文字的信息处理,盛炎中文信息处理若干重要问题,徐波等,科学出版社Natural Language Understanding,James Allen,Foundations of Statistica
7、l Natural Language Processing,Christopher D.Manning,Hinrich Schutze,对外经贸大学中文学院.对外汉语,语言信息处理领域主要学术会议及活动ACL(Association for Computational Linguistics)美国计算语言学会COLING(International Conference on Computational Linguistics)国际计算语言学会议TREC(Text REtrieval Conference)CNCCL(全国计算语言学联合学术会议)附件:HLTwebs.html,对外经贸大学中文
8、学院.对外汉语,考试方式,平时成绩(30%)=课堂作业+课下作业+出勤 期中考试(20%):课程报告(研究报告或读书报告)期末考试(50%):以填空、名词解释、简答和论述为主,对外经贸大学中文学院.对外汉语,祝大家新学期学习进步、生活快乐!,对外经贸大学中文学院.对外汉语,本章内容,语言信息处理的方向语言信息处理的对象语言信息处理的学科定位语言信息处理的目标语言信息的理解处理所需的知识自然语言处理的根本问题语言理解处理系统的评价自然语言处理的研究方法自然语言处理的发展历史自然语言处理系统的总体构成,对外经贸大学中文学院.对外汉语,语言信息处理的方向,分析(理解)analyze,understa
9、nd 生成(表达)generate or produce,express实现人机交互意味着要使计算机既能理解自然语言文本的意义,也能以自然语言文本来表达给定的意图、思想等。后者称为自然语言生成。“矮墙和低墙”,对外经贸大学中文学院.对外汉语,语言信息处理的对象,文本(文字流)text书面理解用文字输入,使计算机“看懂”文字符号,也用文字输出应答。将文字输入计算机计算机识别和理解文字、词、短语、句子、段落和篇章按指定的目标作出相应的回答或反映话语(语音流)speech语音理解用口语语音输入,使计算机“听懂”语音信号,用文字或语音合成输出应答。用口语对计算机讲话计算机识别语音输入,把语音流变换为文
10、字流然后按书面语理解最后利用语音合成将回答转换成声音输出,对外经贸大学中文学院.对外汉语,语言信息处理的学科定位,交叉学科:语言学、计算机科学、认知科学、数学、哲学和逻辑学计算机对自然语言的处理一般应经过三个方面:形式化编写算法程序实现,对外经贸大学中文学院.对外汉语,人工智能的分支 AI,Artificial IntelligenceNLU是人工智能的重要内容。自然语言的信息处理是跟计算机的诞生几乎同时开始的一个多学科交叉研究领域。来自计算机科学、语言学、数学等不同学科的研究人员构成了目前这一领域的主要研究力量。随着计算机应用的日益普及,其功能也从主要是数值计算发展到以非数值信息处理为主。因
11、此,语言信息处理处于文科、理科和工科的交叉点上,是建立在语言学、数学和计算机科学这三门学科基础上的边缘性学科。,对外经贸大学中文学院.对外汉语,语言信息处理的目标-理解的定义,最终目标:让电脑像人一样理解语言“目前学界对于理解的理解、有关概念的概念、赋予语义的语义、界定知识的知识都可能是各不相同甚或互不搭界的。”(张普)符号学人工智能认为:“理解”即是表示,理解的过程关注的是表示的构造和使用Fillmore(格语法)认为:理解一个概念决定于我们拥有的背景环境和这个概念本身的背景框架原型匹配的程度Schank(概念依存理论)认为:“理解”是在概念空间中,但不仅仅是一个被动的操作过程,而部分的受我
12、们预期的驱使。,对外经贸大学中文学院.对外汉语,关于理解的不同定义,关于自然语言理解,至今尚无一致的、各方可以接受的定义 自然语言的复杂性多义性、上下文有关性、模糊性、非系统性和环境密切相关性、涉及的知识面广 与应用目标相关微观与宏观角度不一从微观上讲,自然语言理解是指从自然语言到机器内部的一个映射从宏观上看,自然语言是指机器能够执行人类所期望的某些语言功能,对外经贸大学中文学院.对外汉语,语言信息处理的目标-理解的标准,聊天机器人是否具有AI?,图灵测验让一个正常人和电脑分别回答实验者的问题,如果实验者无法分辨出来哪个是人的回答,哪个是机器的回答,那么这台电脑就具有AI。,对外经贸大学中文学
13、院.对外汉语,语言信息处理的目标-理解的标准,对图灵测验的质疑中国屋试验 美国哲学家约翰塞尔语言理解能力的功能定义美国认知心理学家G.M.Olson提出语言理解的四条标志:(1)能成功地回答输入语料中的有关问题:答问(2)在接受一批语料之后,有就此给出摘要的能力:摘要(3)能用不同的词语复述所输入的语料:复述(4)有从一种语言转译成另一种语言的能力:翻译,对外经贸大学中文学院.对外汉语,语言信息处理的目标-理解的标准,理解能力的判定让计算机具有针对自然语言的分析理解与生成表达能力,是自然语言理解/处理的目标。判定一个自然语言处理系统是否具有理解能力,主要依据两点是否从意义上去处理自然语言处理结
14、果是否正确无误。,对外经贸大学中文学院.对外汉语,语言信息的理解处理所需的知识,要让计算机具有这种能力,就需要从语言学知识角度出发构造关于语言理解和生成的计算模型,并且这些模型还要在特定领域背景下表现良好。语言学知识:从语言构成角度:词汇、短语、句子、段落、篇章等 从语言特征角度:,对外经贸大学中文学院.对外汉语,语言信息的理解处理所需的知识,语音知识(Phonetic and phonological knowledge):研究词语与其发音如何关联。这种知识对于基于语音的系统是至关重要的。词法知识(Morphological knowledge):包括词语形态学知识,研究词语如何由被称为词素
15、的更基本的意义单位构成。句法知识(Syntactic knowledge):研究词语是如何排列以组成正确的句子,并决定每个单词在句子中所充当的结构角色,以及短语之间的构成关系。语义知识(Semantic knowledge):词义,及其如何组合成句义,不依赖上下文和客观语境。即研究词语的意义以及在句子中词语意义是如何相互结合以形成句子意义的。这是上下文无关的意义研究,即一个句子在不考虑其上下文的情况下所具有的意义。语用知识(Pragmatic knowledge):研究句子如何在不同语境中的使用,以及这种使用如何影响句子的解释。篇章知识(Discourse knowledge):研究在前面句子
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概述 语言 信息处理 自然语言 理解
链接地址:https://www.31ppt.com/p-6475452.html