自然语言处理-第8章语义和逻辑形式.ppt
《自然语言处理-第8章语义和逻辑形式.ppt》由会员分享,可在线阅读,更多相关《自然语言处理-第8章语义和逻辑形式.ppt(62页珍藏版)》请在三一办公上搜索。
1、第二部分 语义解释,词系列(输入),词系列(输出),句法结构和/或逻辑形式,最终意义,句法结构和逻辑形式,回答的意义,语法剖析,语法剖析,对话规划,句子的实现,词典与语法,对话的语境,应用的环境,语境解释,自然语言理解系统的组织,语法处理过程PART,语义解释PART,语境解释PART,正如引言中提到的,确定句子含义的工作可以分为两步:首先求得称为逻辑形式的上下文无关含义;然后,根据上下文来解释逻辑形式,并产生最终含义表示。本书的第二部分关心的是这两步中的第一步,该步骤称为语义解释。通常,在语言学上也有类似的划分:上下文无关含义的研究称为语义学(semantics);语言中上下文的研究称为语用
2、学(pragmatics)。本部分将讨论的一部分问题如下:利用上下文无关的结构限制来删除部分可能的词义;识别每个单词和短语在逻辑形式中所扮演的语义角色,特别是谓词/变元与修饰成分的关系;识别源于句子结构的相互联系的限制(co-reference restrictions)。,第二部分 语义解释,第8章 语义和逻辑形式 更详细地讨论了逻辑形式与最终含义表示的区别,并介绍了一种将用于本书的其余部分的逻辑形式语言。第9章 把句法和语义相联系 讨论如何将逻辑形式与句法结构相联系,并说明如何以基于规则的方式利用文法中的特征系统来识别逻辑形式。第10章 歧义的消解 讨论歧义的消解中的重大问题,并说明如何将
3、语义限制或参数选择用于识别那些似乎是最合理的词义及语义结构。第11章 语义解释的其它策略 讨论一些已经在现有系统及应用中证实是有效的交互式语义解释方法。第12章 辖域和名词短语的解释 讨论语义解释中的一些更高级的问题,包括辖域从属物的分析。,第八章 语义和逻辑形式 8.1 语义和逻辑形式介绍含义和语义的基本概念,并描述了逻辑形式在语义处理中的作用。8.2 词义与歧义介绍了词义和基本的语义,并讨论了词义歧义问题。8.3 基本逻辑形式语言描述了用于表示句子的上下文无关含义的基本逻辑形式语言。8.4 逻辑形式中歧义的表示进一步推广了8.3节的讨论,介绍了一些可以简洁地表示歧义的某些共同形式的结构。8
4、.5 逻辑形式中的动词和状态讨论动词的表示法以及状态和事件的概念。8.6 主题角色讨论主题的作用,并说明如何通过动词的含义来获得各种语义概要。8.7 语言行为和嵌入句介绍了表层语言行为的概念,并讨论了逻辑形式中嵌入句的处理。*8.8 语义结构的定义:模型理论为逻辑形式语言描述了一套模型理论,并讨论了句子间可定义为继承和蕴含的各种语义关系。,8.1 语义和逻辑形式,语义(semantics)和含义(meaning)很难精确定义语义和含义这两个概念;这里所讨论的含义接近于解释词语时的用法,即用于一种特殊语言来解释词义及句子含义;由于歧义的存在,要给句子的含义下个定义是困难的。例1Do you kn
5、ow what gate you are going to?Which gate is it?是否存在一个与上下文无关的句子的含义?即,是否存在一个使句子只有一个含义但又可用于不同的目的的层次?主要的争论在于模块性(modularity)。若存在,则不需要考虑句子用法的复杂因素就可以详细研究句子的含义,但确实有大量句子的含义是取决于上下文的。若不存在,则不能将语言的与一般人类推论及上下文的研究分隔开来,但又确实存在许多基于词语含义限制的实例都是上下文无关的。,基本术语,含义(meaning):用于上下文无关意义上。用法(usage):用于上下文有关方面。逻辑形式(logical form):上
6、下文无关含义的表示法。语义解释(semantic interpretation):从句子到逻辑形式的映射过程。语境解释(contextual interpretation):从逻辑形式到最终知识表示(KR)语言的映射过程。,句法分析 S NP VP ART NV ADJP theballis red语义解释逻辑形式(RED1)语境解释最终表示Red(BO73),图8.1 逻辑形式作为中间表示法,图8.2,如何定义逻辑形式?(一),思路一:假定知识表示语言是首序谓词逻辑公式(first-order predicate calculus,FOPC),将逻辑形式定义成句子的字面含义,且逻辑形式语言与
7、最终知识表示语言相同。缺点 要使该方法最终可行,知识表示必须比目前AI系统中使用的复杂得多。带索引的词条(terms):即由上下文定义的词条,包括代词(如I和you)、大部分的明确描述(如the red ball)等等,它们的解释(即所提及的对象)只有通过上下文才能识别出来。例 The red ball dropped。对于每个可以被描述为红色的球状物的可能的对象,就需要要有一个不同的逻辑形式,这显然是不切实际的。语言中还有诸如时态、量词的作用域等许多方面,它们也取决于上下文,在逻辑形式层上无法唯一确定。如果在该层上将所有的这些看作歧义,将使得每个句子有大量的可能的逻辑形式,这显然是不切实际的
8、。,如何定义逻辑形式?(二),思路二:逻辑形式语言不是知识表示语言的一部分,并且使用情景这一概念。情景(situation)情景是世界上的一组特殊的环境;更正式地,情景是一组对象(object)及这些对象间的关系。例1 情景对象:一个球B0005、一个人P86关系:这个人拥有这个球 集合(BALL B0005),(PERSON P86),(OWNS P86 B0005)逻辑形式可以看作是情景间的函数,它将由对话产生的对话情景映射为由该对话事件而引起的一个新的对话情景。在任何会话或正文中,假设有一个对话情景,它记录了到目前为止所传达的全部信息。一个新的句子是依据这个情景来解释的,并且产生了一个新
9、情景,新情景中包含了这个新句子所传达的信息。例2 假设上例中那个情景是根据前面一些描述这个球及拥有它的人的句子建立的。The ball is red这句话可能产生一个由原有的情景再加上B0005具有RED属性这个新事实组成的新情景,即(BALL B0005),(PERSON P86),(OWNS P86 B0005),(RED B0005)。,句法分析 S NP VP ART NV ADJP theballis red 语义解释逻辑形式(ASSERT(RED1)(BALL B0005),(BALL B0005),(PERSON P86),语境解释(PERSON P86),(OWNS P86 B
10、0005)(OWNS P86 B0005),(RED B0005)最初的对话情景 最新的对话情景,图8.2 逻辑形式作为函数 图8.1和8.2所示的这两种结构的区别:在完全获得句子含义的知识表示中,后者可包含多个可确认的表示,这种逻辑形式在产生新的情景时可能有各种变化,因而可从一个对话中得到其它暗示,且这些是无法从句子的语义内容中直接获得的。这个问题在讨论语境解释时将变得很重要的。,如何定义逻辑形式?(二),思路二:逻辑形式语言不是知识表示语言的一部分,并且使用情景这一概念。情景(situation)将语言中上下文无关的语义结构用于构造逻辑形式 尽管语言中的很多方面是高度地上下文有关的,但仍有
11、相当一部分语义结构是上下文无关的。上下文无关的语义知识大多是由那些可在字典中找到的信息组成的。这些信息包括:单词的基本语义特征(即,它们是否涉及关系、对象等等);每个单词可能有哪些不同的词义(sense);哪些词义可以结合成更大的语义结构等等。识别上下文无关的信息形式并将这些信息用于逻辑形式的运算正是本书的第二部分的焦点。,返回,8.2 词义与歧义,一、词义(word senses)基本语义单位是词义(word senses),而不是单词(word)或词素(morpheme);因为单词的歧义普遍存在,如果将单词或词素作为基本语义单位,将会遇到难题。例 在典型的字典中动词go有多于40个解释项是
12、很平常的。每项对应go的一个不同的词义。动词go可能有诸如move,depart,pass,vanish,reach,extend和set out等同义词。其中许多同义词体现了go的不同词义。如果每个单词有一个或更多的词义,虽然单词的某些特殊词义存在着同义词,那么即使假设这些同义词可以共享着完全相同的词义,所要考虑的词义仍然数量巨大;,词义的分类-实体集(一),对象类(classes of objects):可以将不同的词义组织成各种对象类,并用这些对象类对世界进行归类。实体集(ontology):表示法中各种不同对象类的集合。在自然语言处理中,需要建立比形式逻辑中更为广泛的实体集。主要对象类
13、:物质(物质对象,substance)、数量(quantity,诸如数)、特质(quality,诸如bright,red)、关系(relation)、地点(place)、时间(time)、位置(position)、状态(state)、动作(action)和感情(affection),以及事件(events)、思想(ideas)、概念(concepts)和计划(plans)等等。,词义的分类-实体集(二),最有重要的三类:事件、动作、情景。事件(events)是世界上发生的事物,它提供了一种用于组织句子解释的结构。动作(actions)是施事者所做的事物,从而产生了某一事件。注与实体论中的所有对
14、象一样,动作和时间可以用代词来引用。例 We lifted the box.It was hard work.情景(situation)指的是一组特殊的环境,可以看作是包含了事件的概念。在许多情况下,情景可被当作是一种涉及某些地点和时间的世界的抽象化。例 We laughed and sang at the football game描述的是一组在特定的时间和地点内进行的活动,称为the football game情景。,二、歧义(ambiguity),语义歧义(semantic ambiguity):如果一个单词对应不止一个词义,则称这个单词是语义歧义的。词汇歧义(lexical ambig
15、uity)问题怎样确定哪些是恰当的词义?如何更精确地定义语义歧义这一概念?例1)kid:小山羊;小孩;2)horse:马,可以细分为母马、小马、快马等等。解决方法利用一些语言学的测试。以名词为例,有一种测试是利用某些句法的构造典型地需要涉及相同的对象类这样一个特征。这种测试提供了一种验证我们的词义直觉的有效方法。例 1)I have two kids and George has three.George和我都是山羊主(kid BABY-GOAT1)George和我都有孩子(kid BOBY-HUMAN1)但不可能意味着这两者的合并(如我有山羊而George有孩子)。2)I have one
16、horse and George has two.(horse HORSE1)我有一匹马(小马/母马/.)而George有两匹(小马/母马/.)。,歧义,词汇歧义(二),含糊(vagueness)有些词义比其它的更特殊,具有通常被称为含糊的特征。而且实际上,所有词义都包含了某种程度的含糊,因为它们总是可以有某些更精确的说明。例 HORSE1并不区分母马和小马;MARE1并不区分大母马还是小母马。动词也有含糊现象,也可以构造一种类似的歧义测试。例 1)I ran last year and George did too.我和George都是选举中的候选人(run RUN2(政治))我和Georg
17、e都参加了某次赛跑(run RUN1(锻炼))2)I kissed Sue and George did too.kiss并没有具体说明被吻的是哪儿,是含糊的。即使我吻了Sue的脸颊而George吻了她的手,仍可以这么说。量词也有类似的含糊。例 Many people saw the accident.量词many就包含多少人而言是含糊的。,歧义,结构歧义(structural ambiguity),有些结构歧义形式依附于基本的句法歧义。因此,尽管这种歧义确实有语义的结果,但它来源于句法结构,而不是语义;例 Happy cats and dogs live on the farm.对于狗是否快
18、乐是有歧义的,根源在于句法结构上连接词and所连接的两个NP的结构有歧义,即:快乐的猫和快乐的狗(happy(cats and dogs)快乐的猫和任意心情的狗(happy cats)and(dogs)产生于唯一的句法结构的其它结构歧义形式确实是语义的。一个很常见的例子是量词的作用域。例 Every boy loves a dog.所有的男孩都喜爱同一条狗FOPC:d,Dog(d)&b,Boy(b)Loves(b,d)每个男孩喜欢的可能是不同的狗FOPC:b,Boy(b)d,Dog(d)&Loves(b,d)注意 虽然代词(如you,I和here)、词组(如the dog)等索引项的指代取决于
19、上下文(这个问题将在第12章中讨论),但在这里它们并不被看作是歧义;相反地,它们都有明确的唯一的含义。,句法结构是相同的,但量词的作用域不同。,上下文无关语义的一个很重要的方面产生于词义的共同出现(co-occurrence)限制。通常,可根据句子其它部分的结构和含义确定出单词的正确词义。例 动词run 慢跑时的动作,通常作不及物动词(intransitive verb),如:Jack ran in the park;操作机器的动作,作及物动词(transitive verb),如:Jack ran the printing press for years。在其它情况中,若句法结构是相同的,单
20、词的可能的词义就只能用某些的方法来获得。例 Jack ran in the park.Jack ran in the election.语义解释的一个最重要的任务是利用类似的限制来帮助减少每个词可能的词义数目。,词义的共同出现(co-occurrence)限制-初步消歧,句法结构相同,但为使语义合理,run必须选择不同的词义。,返回,8.3 基本逻辑形式语言,各种等价的逻辑形式表示法,如首序谓词逻辑公式(FOPC)、基于网络的表示法等,它们的基本思想相同,即将词义作为表示法的原子(atoms)或常量(constants)。常量的分类 根据所描述的事物的类型归类:项(terms):那些描述世界上
21、的对象(包括事件、情景等抽象对象的)的常量;谓词(predicates);描述关系和特征的常量。可进一步分为:一元谓词(unary predicates)或特性(properties):仅需要一个变元的谓词;二元谓词(binary predicates):需要两个变元的谓词(如LOVE1);n元谓词(n-ary predicates):需要n个变元的谓词。命题(proposition):由一个谓词及跟在其后作为变元的数目合适的项构成。例1 句子:Fido is a dog.命题:(DOG1 FIDO1)例2 句子:Sue loves Jack.命题:(LOVE1 SUE1 JACK1),项,一
22、元谓词,二元谓词,常量的分类(二),英语中的词类与逻辑形式中的常量类型的对应关系:专有名词(proper name),如Jack,属于项;普通名词,如dog,属于一元谓词;动词,如run,love,put,属于n元谓词,其中n取决于这个动词需要多少项。其它大多数语义表示法中也有与谓词变元形式同似的特征。例如,网络表示法中有对应于词义的节点及用来表示谓词-变元结构的弧。在语义网络式的表示法中,句子Sue loves Jack的含义可以表示为图8.3中所示的两种形式之一。在大多数用途中,所有这些表示形式都是等价的。,LOVES1 LOVES1 1 2 pred SUE1JACK1 11 agent
23、 themeSUE1JACK1,图8.3 Sue loves Jack的两种可能的网络表示,可用于构造复杂的命题的几类重要常量,逻辑运算符(logical operators)可以将两个或更多的命题组合成一个复杂命题例 运算符NOT可以用来构造一个表示某命题非真的命题。Sue does not love Jack.(NOT(LOVE1 SUE1 JACK1)FOPC中的逻辑运算符,即析取(disjunction,)、合取(conjunction,&)、蕴含(implication,)等等共16种运算符。自然语言中的连接词(connectives),如英语中的or、and、if、only if等
24、等也属于这类运算符。而且,它们通常包含了更复杂的句子间的关系。例 连接词and可以对应于逻辑运算符&,但也常用于时间序列,如I went home and had a drink。此外,连接词but除了旁听者根据第一个变元可能无法料想到第二个变元是真的以外,与and是相似的。这类命题的通用形式是(连接词 命题 命题)。例 Jack loves Sue or Jack loves Mary.(OR1(LOVE1 JACK1 SUE1)(LOVE1 JACK1 MARY1)逻辑形式语言中既允许对应于词义的运算符,也允许像&之类的直接来自于FOPC的运算符。基于逻辑的运算符将用来连接那些在句中没有明
25、确连接的命题。,量词(quantifiers),FOPC中只有两个量词:和。英语中含有相当多的量词(一般量词的必要性,见BOX 8.1),如all、some、most、many、a few、the等等。为了允许量词,与FOPC中一样需引入变量,但它们的区别在于量词的有效范围:FOPC中,变量仅在量词的作用域内有效。因此,出现在不同公式中的同一个变量将被看作是完全不同的变量,它们之间没有任何的关系。例 x,P(x);x,Q(x)自然语言中则不同,变量在被引入之后似乎是持续存在的。例 A man entered the room.He walked over to the table.第一个句子引
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自然语言 处理 语义 逻辑 形式
链接地址:https://www.31ppt.com/p-5823156.html