自然语言处理-第8章语义和逻辑形式.ppt
第二部分 语义解释,词系列(输入),词系列(输出),句法结构和/或逻辑形式,最终意义,句法结构和逻辑形式,回答的意义,语法剖析,语法剖析,对话规划,句子的实现,词典与语法,对话的语境,应用的环境,语境解释,自然语言理解系统的组织,语法处理过程PART,语义解释PART,语境解释PART,正如引言中提到的,确定句子含义的工作可以分为两步:首先求得称为逻辑形式的上下文无关含义;然后,根据上下文来解释逻辑形式,并产生最终含义表示。本书的第二部分关心的是这两步中的第一步,该步骤称为语义解释。通常,在语言学上也有类似的划分:上下文无关含义的研究称为语义学(semantics);语言中上下文的研究称为语用学(pragmatics)。本部分将讨论的一部分问题如下:利用上下文无关的结构限制来删除部分可能的词义;识别每个单词和短语在逻辑形式中所扮演的语义角色,特别是谓词/变元与修饰成分的关系;识别源于句子结构的相互联系的限制(co-reference restrictions)。,第二部分 语义解释,第8章 语义和逻辑形式 更详细地讨论了逻辑形式与最终含义表示的区别,并介绍了一种将用于本书的其余部分的逻辑形式语言。第9章 把句法和语义相联系 讨论如何将逻辑形式与句法结构相联系,并说明如何以基于规则的方式利用文法中的特征系统来识别逻辑形式。第10章 歧义的消解 讨论歧义的消解中的重大问题,并说明如何将语义限制或参数选择用于识别那些似乎是最合理的词义及语义结构。第11章 语义解释的其它策略 讨论一些已经在现有系统及应用中证实是有效的交互式语义解释方法。第12章 辖域和名词短语的解释 讨论语义解释中的一些更高级的问题,包括辖域从属物的分析。,第八章 语义和逻辑形式 8.1 语义和逻辑形式介绍含义和语义的基本概念,并描述了逻辑形式在语义处理中的作用。8.2 词义与歧义介绍了词义和基本的语义,并讨论了词义歧义问题。8.3 基本逻辑形式语言描述了用于表示句子的上下文无关含义的基本逻辑形式语言。8.4 逻辑形式中歧义的表示进一步推广了8.3节的讨论,介绍了一些可以简洁地表示歧义的某些共同形式的结构。8.5 逻辑形式中的动词和状态讨论动词的表示法以及状态和事件的概念。8.6 主题角色讨论主题的作用,并说明如何通过动词的含义来获得各种语义概要。8.7 语言行为和嵌入句介绍了表层语言行为的概念,并讨论了逻辑形式中嵌入句的处理。*8.8 语义结构的定义:模型理论为逻辑形式语言描述了一套模型理论,并讨论了句子间可定义为继承和蕴含的各种语义关系。,8.1 语义和逻辑形式,语义(semantics)和含义(meaning)很难精确定义语义和含义这两个概念;这里所讨论的含义接近于解释词语时的用法,即用于一种特殊语言来解释词义及句子含义;由于歧义的存在,要给句子的含义下个定义是困难的。例1Do you know what gate you are going to?Which gate is it?是否存在一个与上下文无关的句子的含义?即,是否存在一个使句子只有一个含义但又可用于不同的目的的层次?主要的争论在于模块性(modularity)。若存在,则不需要考虑句子用法的复杂因素就可以详细研究句子的含义,但确实有大量句子的含义是取决于上下文的。若不存在,则不能将语言的与一般人类推论及上下文的研究分隔开来,但又确实存在许多基于词语含义限制的实例都是上下文无关的。,基本术语,含义(meaning):用于上下文无关意义上。用法(usage):用于上下文有关方面。逻辑形式(logical form):上下文无关含义的表示法。语义解释(semantic interpretation):从句子到逻辑形式的映射过程。语境解释(contextual interpretation):从逻辑形式到最终知识表示(KR)语言的映射过程。,句法分析 S NP VP ART NV ADJP theballis red语义解释逻辑形式(RED1)语境解释最终表示Red(BO73),图8.1 逻辑形式作为中间表示法,图8.2,如何定义逻辑形式?(一),思路一:假定知识表示语言是首序谓词逻辑公式(first-order predicate calculus,FOPC),将逻辑形式定义成句子的字面含义,且逻辑形式语言与最终知识表示语言相同。缺点 要使该方法最终可行,知识表示必须比目前AI系统中使用的复杂得多。带索引的词条(terms):即由上下文定义的词条,包括代词(如I和you)、大部分的明确描述(如the red ball)等等,它们的解释(即所提及的对象)只有通过上下文才能识别出来。例 The red ball dropped。对于每个可以被描述为红色的球状物的可能的对象,就需要要有一个不同的逻辑形式,这显然是不切实际的。语言中还有诸如时态、量词的作用域等许多方面,它们也取决于上下文,在逻辑形式层上无法唯一确定。如果在该层上将所有的这些看作歧义,将使得每个句子有大量的可能的逻辑形式,这显然是不切实际的。,如何定义逻辑形式?(二),思路二:逻辑形式语言不是知识表示语言的一部分,并且使用情景这一概念。情景(situation)情景是世界上的一组特殊的环境;更正式地,情景是一组对象(object)及这些对象间的关系。例1 情景对象:一个球B0005、一个人P86关系:这个人拥有这个球 集合(BALL B0005),(PERSON P86),(OWNS P86 B0005)逻辑形式可以看作是情景间的函数,它将由对话产生的对话情景映射为由该对话事件而引起的一个新的对话情景。在任何会话或正文中,假设有一个对话情景,它记录了到目前为止所传达的全部信息。一个新的句子是依据这个情景来解释的,并且产生了一个新情景,新情景中包含了这个新句子所传达的信息。例2 假设上例中那个情景是根据前面一些描述这个球及拥有它的人的句子建立的。The ball is red这句话可能产生一个由原有的情景再加上B0005具有RED属性这个新事实组成的新情景,即(BALL B0005),(PERSON P86),(OWNS P86 B0005),(RED B0005)。,句法分析 S NP VP ART NV ADJP theballis red 语义解释逻辑形式(ASSERT(RED1)(BALL B0005),(BALL B0005),(PERSON P86),语境解释(PERSON P86),(OWNS P86 B0005)(OWNS P86 B0005),(RED B0005)最初的对话情景 最新的对话情景,图8.2 逻辑形式作为函数 图8.1和8.2所示的这两种结构的区别:在完全获得句子含义的知识表示中,后者可包含多个可确认的表示,这种逻辑形式在产生新的情景时可能有各种变化,因而可从一个对话中得到其它暗示,且这些是无法从句子的语义内容中直接获得的。这个问题在讨论语境解释时将变得很重要的。,如何定义逻辑形式?(二),思路二:逻辑形式语言不是知识表示语言的一部分,并且使用情景这一概念。情景(situation)将语言中上下文无关的语义结构用于构造逻辑形式 尽管语言中的很多方面是高度地上下文有关的,但仍有相当一部分语义结构是上下文无关的。上下文无关的语义知识大多是由那些可在字典中找到的信息组成的。这些信息包括:单词的基本语义特征(即,它们是否涉及关系、对象等等);每个单词可能有哪些不同的词义(sense);哪些词义可以结合成更大的语义结构等等。识别上下文无关的信息形式并将这些信息用于逻辑形式的运算正是本书的第二部分的焦点。,返回,8.2 词义与歧义,一、词义(word senses)基本语义单位是词义(word senses),而不是单词(word)或词素(morpheme);因为单词的歧义普遍存在,如果将单词或词素作为基本语义单位,将会遇到难题。例 在典型的字典中动词go有多于40个解释项是很平常的。每项对应go的一个不同的词义。动词go可能有诸如move,depart,pass,vanish,reach,extend和set out等同义词。其中许多同义词体现了go的不同词义。如果每个单词有一个或更多的词义,虽然单词的某些特殊词义存在着同义词,那么即使假设这些同义词可以共享着完全相同的词义,所要考虑的词义仍然数量巨大;,词义的分类-实体集(一),对象类(classes of objects):可以将不同的词义组织成各种对象类,并用这些对象类对世界进行归类。实体集(ontology):表示法中各种不同对象类的集合。在自然语言处理中,需要建立比形式逻辑中更为广泛的实体集。主要对象类:物质(物质对象,substance)、数量(quantity,诸如数)、特质(quality,诸如bright,red)、关系(relation)、地点(place)、时间(time)、位置(position)、状态(state)、动作(action)和感情(affection),以及事件(events)、思想(ideas)、概念(concepts)和计划(plans)等等。,词义的分类-实体集(二),最有重要的三类:事件、动作、情景。事件(events)是世界上发生的事物,它提供了一种用于组织句子解释的结构。动作(actions)是施事者所做的事物,从而产生了某一事件。注与实体论中的所有对象一样,动作和时间可以用代词来引用。例 We lifted the box.It was hard work.情景(situation)指的是一组特殊的环境,可以看作是包含了事件的概念。在许多情况下,情景可被当作是一种涉及某些地点和时间的世界的抽象化。例 We laughed and sang at the football game描述的是一组在特定的时间和地点内进行的活动,称为the football game情景。,二、歧义(ambiguity),语义歧义(semantic ambiguity):如果一个单词对应不止一个词义,则称这个单词是语义歧义的。词汇歧义(lexical ambiguity)问题怎样确定哪些是恰当的词义?如何更精确地定义语义歧义这一概念?例1)kid:小山羊;小孩;2)horse:马,可以细分为母马、小马、快马等等。解决方法利用一些语言学的测试。以名词为例,有一种测试是利用某些句法的构造典型地需要涉及相同的对象类这样一个特征。这种测试提供了一种验证我们的词义直觉的有效方法。例 1)I have two kids and George has three.George和我都是山羊主(kid BABY-GOAT1)George和我都有孩子(kid BOBY-HUMAN1)但不可能意味着这两者的合并(如我有山羊而George有孩子)。2)I have one horse and George has two.(horse HORSE1)我有一匹马(小马/母马/.)而George有两匹(小马/母马/.)。,歧义,词汇歧义(二),含糊(vagueness)有些词义比其它的更特殊,具有通常被称为含糊的特征。而且实际上,所有词义都包含了某种程度的含糊,因为它们总是可以有某些更精确的说明。例 HORSE1并不区分母马和小马;MARE1并不区分大母马还是小母马。动词也有含糊现象,也可以构造一种类似的歧义测试。例 1)I ran last year and George did too.我和George都是选举中的候选人(run RUN2(政治))我和George都参加了某次赛跑(run RUN1(锻炼))2)I kissed Sue and George did too.kiss并没有具体说明被吻的是哪儿,是含糊的。即使我吻了Sue的脸颊而George吻了她的手,仍可以这么说。量词也有类似的含糊。例 Many people saw the accident.量词many就包含多少人而言是含糊的。,歧义,结构歧义(structural ambiguity),有些结构歧义形式依附于基本的句法歧义。因此,尽管这种歧义确实有语义的结果,但它来源于句法结构,而不是语义;例 Happy cats and dogs live on the farm.对于狗是否快乐是有歧义的,根源在于句法结构上连接词and所连接的两个NP的结构有歧义,即:快乐的猫和快乐的狗(happy(cats and dogs)快乐的猫和任意心情的狗(happy cats)and(dogs)产生于唯一的句法结构的其它结构歧义形式确实是语义的。一个很常见的例子是量词的作用域。例 Every boy loves a dog.所有的男孩都喜爱同一条狗FOPC:d,Dog(d)&b,Boy(b)Loves(b,d)每个男孩喜欢的可能是不同的狗FOPC:b,Boy(b)d,Dog(d)&Loves(b,d)注意 虽然代词(如you,I和here)、词组(如the dog)等索引项的指代取决于上下文(这个问题将在第12章中讨论),但在这里它们并不被看作是歧义;相反地,它们都有明确的唯一的含义。,句法结构是相同的,但量词的作用域不同。,上下文无关语义的一个很重要的方面产生于词义的共同出现(co-occurrence)限制。通常,可根据句子其它部分的结构和含义确定出单词的正确词义。例 动词run 慢跑时的动作,通常作不及物动词(intransitive verb),如:Jack ran in the park;操作机器的动作,作及物动词(transitive verb),如:Jack ran the printing press for years。在其它情况中,若句法结构是相同的,单词的可能的词义就只能用某些的方法来获得。例 Jack ran in the park.Jack ran in the election.语义解释的一个最重要的任务是利用类似的限制来帮助减少每个词可能的词义数目。,词义的共同出现(co-occurrence)限制-初步消歧,句法结构相同,但为使语义合理,run必须选择不同的词义。,返回,8.3 基本逻辑形式语言,各种等价的逻辑形式表示法,如首序谓词逻辑公式(FOPC)、基于网络的表示法等,它们的基本思想相同,即将词义作为表示法的原子(atoms)或常量(constants)。常量的分类 根据所描述的事物的类型归类:项(terms):那些描述世界上的对象(包括事件、情景等抽象对象的)的常量;谓词(predicates);描述关系和特征的常量。可进一步分为:一元谓词(unary predicates)或特性(properties):仅需要一个变元的谓词;二元谓词(binary predicates):需要两个变元的谓词(如LOVE1);n元谓词(n-ary predicates):需要n个变元的谓词。命题(proposition):由一个谓词及跟在其后作为变元的数目合适的项构成。例1 句子:Fido is a dog.命题:(DOG1 FIDO1)例2 句子:Sue loves Jack.命题:(LOVE1 SUE1 JACK1),项,一元谓词,二元谓词,常量的分类(二),英语中的词类与逻辑形式中的常量类型的对应关系:专有名词(proper name),如Jack,属于项;普通名词,如dog,属于一元谓词;动词,如run,love,put,属于n元谓词,其中n取决于这个动词需要多少项。其它大多数语义表示法中也有与谓词变元形式同似的特征。例如,网络表示法中有对应于词义的节点及用来表示谓词-变元结构的弧。在语义网络式的表示法中,句子Sue loves Jack的含义可以表示为图8.3中所示的两种形式之一。在大多数用途中,所有这些表示形式都是等价的。,LOVES1 LOVES1 1 2 pred SUE1JACK1 11 agent themeSUE1JACK1,图8.3 Sue loves Jack的两种可能的网络表示,可用于构造复杂的命题的几类重要常量,逻辑运算符(logical operators)可以将两个或更多的命题组合成一个复杂命题例 运算符NOT可以用来构造一个表示某命题非真的命题。Sue does not love Jack.(NOT(LOVE1 SUE1 JACK1)FOPC中的逻辑运算符,即析取(disjunction,)、合取(conjunction,&)、蕴含(implication,)等等共16种运算符。自然语言中的连接词(connectives),如英语中的or、and、if、only if等等也属于这类运算符。而且,它们通常包含了更复杂的句子间的关系。例 连接词and可以对应于逻辑运算符&,但也常用于时间序列,如I went home and had a drink。此外,连接词but除了旁听者根据第一个变元可能无法料想到第二个变元是真的以外,与and是相似的。这类命题的通用形式是(连接词 命题 命题)。例 Jack loves Sue or Jack loves Mary.(OR1(LOVE1 JACK1 SUE1)(LOVE1 JACK1 MARY1)逻辑形式语言中既允许对应于词义的运算符,也允许像&之类的直接来自于FOPC的运算符。基于逻辑的运算符将用来连接那些在句中没有明确连接的命题。,量词(quantifiers),FOPC中只有两个量词:和。英语中含有相当多的量词(一般量词的必要性,见BOX 8.1),如all、some、most、many、a few、the等等。为了允许量词,与FOPC中一样需引入变量,但它们的区别在于量词的有效范围:FOPC中,变量仅在量词的作用域内有效。因此,出现在不同公式中的同一个变量将被看作是完全不同的变量,它们之间没有任何的关系。例 x,P(x);x,Q(x)自然语言中则不同,变量在被引入之后似乎是持续存在的。例 A man entered the room.He walked over to the table.第一个句子引入一个新的对象,即某一个人。而第二个句子中的代词he所指的就是第一个句子中引入的这个人。因此,每当引入一个新的变量,就给新变量一个前面没用过的唯一的名字。在正确的环境中,后面的句子可以重新引用该变量。,广义量词(generalized quantifiers),自然语言中的量词有受限范围,比FOPC中的要复杂,因此需要引入广义量词;例 FOPC:x,Px为真 对于论域中每个可能的对象(即X可以是该语言中的任意项),Px均为真。自然语言:All dogs bark.Most people laughed.这类量词常用于通用形式:(量词 变量:约束命题 体命题);例 Most dogs bark.(MOST1 d1:(DOG1 d1)(BARKS1 d1)区别:(MOST1 d2:(BARKS1 d2)(DOG1 d2)Most barking things are dogs.广义量词中非常重要的一类是冠词the和a。例 The dog barks.(THE x:(DOG1 x)(BARKS1 x)识别冠词所指代的对象的这一过程需要上下文的指导,关于它的讨论将被放在本书的第三部分。这里只需要写出逻辑形式。,广义量词(generalized quantifiers)(二),更复杂的名词短语将导致更复杂的限制。例 The happy dog barks.(THE x:(&(DOG1 x)(HAPPY x)(BARKS1 x)仅当一个有上下文中唯一的x使得(&(DOG1 x)(HAPPY x)为真并且这个x叫了,该命题才为真。,量词用途例子THE确定的指代the dogA不确定的指代a dogBARE无冠词的单数名词(集合名词)water,foodBARE无冠词的复数名词(泛指)dogs,图8.4 对应于冠词(含冠词省略)的量词特殊子集,复数PLUR(plural),专门用于处理复数形式的结构;以简单谓词为变元从而产生一个新的谓词;例 The dogs bark.(THE x:(PLUR DOG1)x)(BARKS1 x)复数名词短语引入了产生新的歧义的可能性。例1 The dogs bark.有特定的一群狗,它们中的每一只都叫了。例2 The dogs met at the corner.*解释:每一条狗在街角相遇了 解释:整个狗的集合在街角相遇了 个体解释(distributive reading):将谓词分配给集合中的每一个元素。集合解释(collective reading):将集合中的所有元素看作一个整体,谓词作用于整体。有些句子同时允许这两种解释,因此是歧义的。例3 Two men bought a stereo.解释:两个人每人各买了一套音响(个体解释)解释:两个人一起合买了一套音响(集合解释),对任何一只狗都为真的谓词,对任何狗的集合都为真的谓词,个体解释 集合解释,情态运算符(modal operators),用于表示诸如believe、want等动词的含义、时态及其它许多结构;情态运算符看起来与逻辑运算符相似,但它与逻辑运算符及其他谓词有一个主要区别:例 假定某些人知道Jack还有个名字叫John,于是就有两个等价的词义,即JACK1=JOHN22,则:(HAPPY JOHN22)(HAPPY JACK1)(OR(HAPPY JOHN22)(SAD JOHN22)(OR(HAPPY JACK1)(SAD JACK1)(BELIEVE SUE1(HAPPY JACK1)(BELIEVE SUE1(HAPPY JOHN22)在简单命题中,等价项可以相互替代;在逻辑运算符的作用域内,等价项也可以相互替代;在情态运算符的作用域内,不能随意地替代等价项。这通常称为情态动词上下文中的替代失败(failure of substitutivity)。,时态运算符(PAST、PRES和FUT),时态运算符可以表示出时态不同的句子在含义上的区别;例1 John sees Fido.(PRES(SEES1 JOHN1 FIDO1)John saw Fido.(PAST(SEES1 JOHN1 FIDO1)John will see Fido.(FUT(SEES1 JOHN1 FIDO1)时态运算符是自然语言中重要的一类情态运算符,它们也体现了替代失败。例2 考虑运算符PAST。假定两个常量JOHN1和PRESIDENT1,有现在:John是总统 JOHN1和PRESIDENT1等价过去:John不是总统 JOHN1不等于PRESIDENT1又有,John从前见过Fido(PAST(SEES1 JOHN1 FIDO1)但不能因此推断出:总统从前见过Fido(PAST(SEES1 PRESIDENT1 FIDO1)注意:一个命题与它的否命题在过去可能同时为真(但不在同一时间内)。例3 John was happy.和John was not happy.可能都为真,即(PAST(HAPPY JOHN1)和(PAST(HAPPY JOHN1)都为真。,返回,8.4 逻辑形式中歧义的表示,为了在后续的解释过程中处理歧义,最终的逻辑形式必须能够正确地表示歧义;然而一个典型的句子可能有大量不同的逻辑形式,简单地列举所有这些可能的逻辑形式将是不现实的。因此,需要采用一定的方法,将某些常见的歧义折叠起来,在逻辑形式中局部地表示,从而可以借助来自句子其它部分以及句子所处的上下文的附加限制来解决这些歧义。许多研究人员把歧义的表示看作使解释过程中独立于逻辑形式的一层,通常称之为准逻辑形式(quasi-logical form)。,单词歧义的表示,单词的多个词义中,有一部分词义具有不同的结构特性,这些歧义可以根据句子的其他部分来删除。单词的不同词义往往有相同的结构限制。目前,这类歧义的表示方法只能是为句子中词义的每种可能的组合建立一个单独的逻辑形式。为了减少逻辑形式数量的剧增,可以采用与句法结构中处理多特征值时相同的方法,即在任何允许元词义的地方,也允许使用一个可能的元词义集合。例 名词ball:解释 BALL1,指游戏中使用的物体;解释 BALL2,指包含跳舞的社交事件。在不考虑上下文时,Sue watched the ball.(THE b1:(BALL1 b1)(PAST(WATCH1 SUE1 b1)(THE b1:(BALL2 b1)(PAST(WATCH1 SUE1 b1)(THE b1:(BALL1 BALL2 b1)(PAST(WATCH1 SUE1 b1),由量词和运算符的相对作用域引起的歧义,例 8.2中的例句 Every boy loves a dog,解释:所有的男孩都喜爱同一条狗解释:每个男孩喜欢的可能是不同的狗 没有任何上下文无关的方法可以用于解决这类问题,因此句子的最终逻辑形式中应体现这种歧义。如果逐一列举所有可能的作用域,解释的数量将以作用域结构数为指数增长。因此,需要在逻辑形式语言中引入缩写形式,以便将解释折叠在一起。注 较特别的是缩略逻辑形式(abbreviated logical form),它根本就不包含作用域信息。这里采用的方法是在句法上将诸如广义量词之类的结构当作项来处理,使它们出现在由句子的句法结构所确定的位置上,并用尖括号来标记作用域的缩写。该方法可将作用域的所有可能形式(n!种)折叠成一种表示形式。,依赖于不同量词作用域,由量词和运算符的相对作用域引起的歧义(二),例 Every boy loves a dog.(LOVES1)(EVERY b1:(BOY1 b1)(d1:(DOG1 d1)(LOVES b1 d1)(d1:(DOG1 d1)(EVERY b1:(BOY1 b1)(LOVES b1 d1)注意 这里,假设不存在任何上下文无关的作用域限制。(用于确定运算符作用域的启发式方法将在第12章中讨论。)如果受广义量词约束的是一个含简单一元谓词的命题,可以去掉这个变量来进一步缩写。例,由量词和运算符的相对作用域引起的歧义(三),自然语言中,很多结构对作用域敏感:所有广义量词均受作用域支配;例 At every hotel,the receptionist was friendly.在任何上下文中首选的解释几乎都认为the receptionist是落在every hotel的作用域内,即在每个旅馆里有不同的招待员。诸如否定和时态的运算符也是作用域敏感的。例 Every boy didnt run.有些男孩没有跑但有些跑了(NOT(EVERY b1:(BOY1 b1)(RUN1 b1)没有一个男孩跑了(EVERY b1:(BOY1 b1)(NOT(RUN1 b1)这两种解释可以用一个逻辑形式()来表示。,专有名词(proper names)的表示,在此之前,我们都假定每个专有名词只有一个词义,用于指代论域中的某个对象。实际上,专有名词必须在上下文中解释,如在不同的情景中John这个名字指的可能是不同的人。改进方法是利用一个特性中含有该特定名称的变量,其通用形式为:(NAME),它将在当前上下文中产生一个恰当的具有该名称的对象。例 John ran.(NAME j1 John),代词和其他带索引词的表示,对于代词和其他带索引词,如here和yesterday,也可以构造类似专有名词中的变元,其通用形式为:(PRO)。例 Every man liked him.(PRO m2(HE1 M2)当受PRO约束的是简单的一元谓词时,与广义量词相同,PRO形式通常可缩写。例 he(PRO m2 HE1)注意 本节所介绍的缩写方法并不能获得所有的歧义,因此仍然会有一些句子甚至是那些句法结构唯一的句子,需要使用列表来表示可能的逻辑形式。,返回,8.5 逻辑形式中的动词和状态,逻辑形式中动词的现有表示法丢失了一些信息,并且还有一些令人烦恼的特性。例1 John broke the window with the hammer.The hammer broke the window.The window broke.尽管这些句子都描述了同一类事件,但由于细节不同需要为break定义三个仅仅是元数不同的词义,即BREAK1、BREAK2和BREAK3,则有逻辑形式:1(NAME j1 John)2.()3.()为了保证每个谓词均能被恰当地解释,表示法中还需要这样的公理,即每当1为真,则2也为真;而且每2为真,则3也为真。这类为了确保每个谓词均能被恰当地解释的公理通常称为含义假定(meaning postulates)。但每个动词都必须指明这类限制,这不太方便。,为了表示这类情况及更复杂的副词修饰形式,Davidson(1967)提出在实体集中引入事件。例2 John broke it.(e1:(BREAK e1(NAME j1 John)(PRO i1 IT1)其中,e1表示John 打破了特定的一块窗户这一件事。例3John broke it with the hammer.(e1:(&(BREAK e1(NAME j1 John)(PRO i1 IT1)(INSTR e1)这样做的好处是其它修饰成分,如with the hammer或on Tuesday或in the hallway,可以通过增加包含该事件的断言逐一补充到基本表示中。因而,只需要定义一个词义就可以处理类似动词break在例1中遇到的这类情况。,角色文法(case grammar)中现在仍有影响的观点之一:动词与它的变元之间的抽象语义关系是有限的。这些关系通常称为主题角色或情况角色(thematic roles或case roles)。例4 例1中,John、the hammer和the window在各个句子中扮演的语义角色相同。John是行为者(施事者角色,agent),the window是对象(受事者角色,theme),而the hammer则是打碎这个动作的工具(工具角色,instrument)。尽管不同的研究人员使用的角色集合不同,但所需的关系数一般都很小。这种表示法与语义网络中使用的很相似,语义网络中的所有事物都是用一元或二元关系来表示的。例4 John broke the window.的逻辑形式:(e:(&(BREAK e)(AGENT e(NAME j1 John)(THEME e)形如(e:(&(Event-p e)(Relation1 e obj1).(Relationn e objn)的断言可以缩写为如下形式:(Event-p e Relation1 obj1.Relationn objn),例5 John broke the window的准逻辑形式:(e1 AGENT(NAME j1 John)THEME)除了事件之外,其它动词也可以有类似的变元。只需推广事件的概念,使其包含状态(states),这样就可以使用相同的表示法,并且也可以使用相同的缩写约定。例6Mary was unhappy.的逻辑形式:1.(NAME j1 Mary)把UNHAPPY看作谓词,它表明它所讨论的是一个不愉快的状态,并且可以把Mary作为THEME角色,即2.(s:(s)(THEME(NAME j1 Mary)缩写为:3.(s THEME(NAME j1 Mary)IN-LOC)目前已证明,将事件变量作为原子谓词的变元仍然不足以获得自然语言的全部表示。但目前,事件和状态已经足以体现本书的重要思想。,许多情况下,在公式中使用明确的事件或状态变量是累赘的,而且妨碍了其它思想的表达。因此,我们将根据表达的需要来选择使用不同的表示法。例7Mary sees John.1(PRES(SEES1 l1 AGENT(NAME j1 Mary)THEME(NAME m1 John)2(PRES(l1(&(SEES1 l1)(AGENT l1(NAME j1 Mary)(THEME l1(NAME m1 John)3(PRES(SEES1(NAME j1 Mary)(NAME m1 John)关于主题角色的分析是否必要 以及从主题角色中获得的特征是否能用其它方法从谓词-变元形式的表示法中获得等问题仍有相当多的争论。尽管很难肯定主题角色是必须的,但在许多语义表示语言中采用这种表示法是大有帮助的。,一、主题角色的定义 施事者AGENT 通常,由名词短语来充当AGENT,且该名词短语是句中所描述的动作的煽动者。此外,该动作的意图、意志或责任也都归因于这个AGENT。测试方法:把诸如intentionally或in order to等短语添加到句子中,如果得到的句子正确(且不改变句子原义),则这个作主语的名词短语可以充当AGENT。例1 John intentionally broke the window.John broke the window in order to let in some air.*The hammer intentionally broke the window.*The window broke in order to let in some air.任何有生命的名词短语,即使它处在主语的位置上,也不一定就是充当AGENT。例2*John intentionally died.*Mary remembered her birthday in order to get some presents.,8.6 主题角色(thematic roles),受事者THEME 通常,由名词短语来充当THEME,且该名词短语用于经历了某一变化的某事物或动作的起作用的对象。对及物动词X而言,通常对应于句法中的OBJECT,即问题What was Xed?的答案;对不及物动词而言,通常是THEME作主语,而不是AGENT作主语。例3The rock broke.John broke the rock.I gave John the book.,描述状态或状态变化的角色 与处所(location)或抽象处所有关的角色 区分表示处所或地点的关系与表示移动或路径的关系:AT-LOC表示某物体在何处或者某事物在何处发生。例4Harry walked on the road.The chair is by the door.另一些短语描述的则是处所的改变或者移动的方向或路径,如:描述某事物来自何处的FROM-LOC;描述目的地的TO-LOC;描述轨迹或路径的PATH-LOC。例5I walked from here to school yesterday.FROM-LOCIt fell to the ground.TO-LOCThe birds flew from the lake along the river gorge.FROM=LOC PATH-LOC,这些处所角色可以归纳为两类:表示任意状态值的角色,称为AT角色,如AT-LOC;表示任意状态变化的角色,如FORM、TO、PATH。例6I threw the ball to John.TO-LOCI gave a book to John.TO-POSSI caught the ball from John.FROM-LOCI borrowed a book from John.FROM-POSS 所有格The box contains a ball.AT-LOCJohn owns a book.AT-POSS与时间有关的角色,如AT-TIME、TO-TIME和FORM-TIME;例7I saw the car at 3 oclock.AT-TIMEI work from one until three.FROM-TIME TO-TIME用于一般状态改变的角色例8温度变化:The temperature remains at zero.AT-VALUEThe temperature rose from zero.FROM-VALUE 识别上述这类角色的方法的相似之处都是看描述的是一般的值还是值在某范围内的改