程序设计语言编译原理(第三版)第2章.ppt
第2章高级语言及其语法描述,2.1 程序语言的定义 2.2 高级语言的一般特性(略)2.3 程序语言的语法描述,1,2.1 程序语言的定义,自然语言与计算机语言的区别与联系:,计算机程序语言一个记号系统,类似于自然语言,由语法+语义定义,2,2.1 程序语言的定义,一、语法,一组规则,使用它可以形成和产生一个合式的程序,则这组规则称为语法。,定义了程序的形式结构,是判断输入字符串是否构成一个形式上(即合式)正确程序的依据。,3,2.1 程序语言的定义,二、语义,1.语义规则:一组规则,使用它可以定义一个程序的意义。,离开语义,语言只不过是一堆符号的集合;在许多语言中有着形式上完全相同的语法单位,但含义却不尽相同。,.注意:阐明语义要比阐明语法难得多,现在还没有一种公认的形式系统,借助于它可以自动地构造出实用的编译程序。,本书基于属性文法的语法制导翻译方法较接近形式化,4,2.程序语言的语法描述,基本概念,1.,有穷字母表。中的每个元素。由中的符号所构成的一个有穷序列。空字,不包含任何符号的序列。上的所有符号串的全体,包括。,注:区分:、空集:不含任何元素的集合,:符号:上的符号串:*:,5,2.程序语言的语法描述,.(连接)积:UV=|U V U、V*,V的闭包,V的正则闭包,注:V*中的每个符号串都是由V中的符号串经有限次连接而成的。,6,例:=a,b,U=ab,b V=aa,bb,a,b*=a,b0 a,b1 a,b2.=,a,b,ab,aa,bb,ba.,a,b+=a,ba,b*=a,b,a,b,ab,aa,bb,ba.=a,b,ab,aa,bb,ba.,ab,b aa,bb=abaa,abbb,baa,bbb,U V=,*=,+=,7,2.程序语言的语法描述,一、上下文无关文法,1.定义:,文法:描述语言的语法结构的形式规则(即语法规则)。,上下文无关文法:所定义的语法范畴(或语法单位)是完全独立于这种范畴可能出现的环境的一种文法。,描述语法规则的且独立于环境,描述语法规则,例:英语中,一般句子是由主谓二部分构成。,8,2.程序语言的语法描述,2.文法语法的类比:,分析:The grey wolf will eat the goat.,The grey wolf will eat the goat,直接宾语,名词,动词,谓语,名词,形容词,冠词,主语,句子,助动词,动词原形,冠词,9,2.程序语言的语法描述,.产生句子的规则从产生语言的角度,(1),(2),the grey,(5),(6),(9),will eat,wolf goat,10,2.程序语言的语法描述,B.句子的语法组成终结符号集,非终结符号集,语法规则,开始符号,终结符号集 VT=the,grey,wolf,will,eat,goat,非终结符号集 VN=,语法规则集 P=,开始符号 S=,11,2.程序语言的语法描述,C.句子的派生(推导)根据规则,the the grey the grey wolf the grey wolf the grey wolf will eat the goat,12,2.程序语言的语法描述,D.句子的语义要求,the grey wolf will eat the goatthe grey wolf will eat the wolfthe grey goat will eat the wolfthe grey goat will eat the goat,符合语法且符合语义的句子仅是:the grey wolf will eat the goat,13,2.程序语言的语法描述,3.上下文无关文法的形式定义是一个四元组(,),终结符号集,非空有限集,非终结符号集,非空有限集,终结符号:描述单词符号,组成语言的基本符号,是一个 语言的不可再分的基本符号。例如:基本字,标识符,常数,算符,界符等,非终结符:代表语法范畴,一个非终结符代表一个一定的语 法概念,每个非终结符表示一定符号串的集合。例如:算术表达式,布尔表达式,赋值句,分程序,过程等,14,2.程序语言的语法描述,开始符号,一个特殊的非终结符号,产生式集合,有限集,产生式:定义语法范畴的一种书写规则形式:A AVN,(VTVN)*,注:“”:“定义为”“”:“或”非终结符号:用大写字母、或汉语组代表 终结符:用小写字母代表,至少必须在某个产生式的左部出现一次,15,2.程序语言的语法描述,例1:上下文无关文法:Ei|EAE A+|*,非终结符号:开始符号:终结符号:,E,A,E,+,*,i,GE,16,2.程序语言的语法描述,例2:算术表达式的文法,标识符(id)(常量、变量)是表达式(E);表达式加一个表达式是表达式;表达式减一个表达式是表达式;表达式乘一个表达式是表达式;表达式除一个表达式是表达式;表达式加上括号是表达式;,Eid EE+E EE-E EE*E EE/E E(E),P:Eid|E+E|E-E|E*E|E/E|(E),17,2.程序语言的语法描述,.文法与语言的关系,中心思想:从文法的开始符号出发,反复连续使用产 生式,对非终结符施行替换和展开。,一个上下文无关文法如何定义一个语言呢?,18,2.程序语言的语法描述,()(+)(+)(+),例:Eid|E+E|E-E|E*E|E/E|(E)(i+i),注:我们可以从出发,进行一系列的推导,推出种种不 同的算术表达式出来,该推导过程证明了(+)是文法所定义的一个算术表达式。,19,2.程序语言的语法描述,“”:,若,则称该序列是从至的一个推导(可推导出),表示“直接推出”,即仅推出一步。,A,仅当 是一个产生式,且,()*,“推导”:,从出发,经过步或若干步,可推导出,从出发,经一步或若干步,可推导出,注:符号的含义,20,2.程序语言的语法描述,“句型”:设是一个文法,是其开始符号,,(VN)*,*,5.语言,“句子”:仅含终结符号的句型是一个句子。,21,2.程序语言的语法描述,6.最左右推导定义:任何一步 都是对中的最左最右非终结符进行替换的。,+()(*+)(*+)(+)(),+()(+)()()()(),最左推导:,最右推导:,22,练习:GS:Sa|(T)TT,S|S分别给出下列句子的最左和最右推导过程:(1)(a,(a,a)(2)(a,(a,),(1)最左推导:S=(T)=(T,S)=(S,S)=(a,S)=(a,(T)=(a,(T,S)=(a,(S,S)=(a,(a,S)=(a,(a,a),(2)最左推导:S=(T)=(T,S)=(S,S)=(a,S)=(a,(T)=(a,(T,S)=(a,(S,S)=(a,(a,S)=(a,(a,),23,2.程序语言的语法描述,.(),24,2.程序语言的语法描述,分析:,与类似,由可知,其必产生,且以此终结,(),,25,2.程序语言的语法描述,例.构造一个文法,使(),分析:与的区别在于,必须使、出现的次数相 等,故而、必须同时出现。,G:,26,2.程序语言的语法描述,思考:考虑文法 DD;D|TL Tint|char LL,id|id定义了一个什么样的语言?,27,2.程序语言的语法描述,二、语法分析树与二义性,.语法分析树用树的形式表示一个句型的推导生成,有助于理解一个句子语法结构的层次。,28,2.程序语言的语法描述,例:()的最左推导(),次 层,结论:一个句型不一定有唯一的一棵语法树。即一个句型的最左右推导可能不唯一。,29,2.程序语言的语法描述,例:()关于文法的另一个最左推导(),()(*)()(+)()(),30,2.程序语言的语法描述,2.二义文法用若一个文法中存在某个句子,它有两个不同的最左右推导,则该文法为二义文法,例:上述文法*(),实质:同一个句子存在两棵语法分析树。,31,2.程序语言的语法描述,例:句子+的最左推导过程,最左推导,+*,*,32,2.程序语言的语法描述,最右推导,+*+,*+,33,2.程序语言的语法描述,注意:,、区分:文法的二义性语言的二义性二义文法无二义文法但()(),34,B、二义问题是不可判定的:即不存在一个算法,它能在有限步骤内,确切的判定一个文法是否为二义的,所能做的只是为无二义性寻找一组充分条件,2.程序语言的语法描述,35,2.程序语言的语法描述,三、形式语言,G=(VT,VN,S,),0型文法:,(VNVT)*,至少有一个非终结符,任何产生式 均满足|;仅S例外,但S不得出现在任何产生式的右部。,1型文法:,短语文法,上下文有关文法,36,2.程序语言的语法描述,2型文法:,A,AVN,(VN VT)*,G的任何产生式为AB或 A其中VT*,A、B VN。,3型文法:,G的任何产生式为A B 或 A,其中VT*,A、B VN。,上下文无关文法,正规文法,右线性正规文法,左线性正规文法,37,