形式语言与自动机文法的一般理论.ppt
《形式语言与自动机文法的一般理论.ppt》由会员分享,可在线阅读,更多相关《形式语言与自动机文法的一般理论.ppt(34页珍藏版)》请在三一办公上搜索。
1、1,形式语言与自动机(Formal Languages and Automata),第二章 文法的一般理论,南京航空航天大学计算机科学与技术学院 胡 军,2023年10月31日星期二,南京航空航天大学计算机学院 胡军,2,2.1 问题的提出 2.2 形式文法与形式语言 2.3 文法的乔姆斯基分类,2023年10月31日星期二,南京航空航天大学计算机学院 胡军,3,2.1 问题的提出,任何有意义的语言都不是任意字符串的集合,而是符合某些规则要求的字符串集合.自然语言(英语,语法);程序设计语言(C语言,文法);文法(Grammar):用有限个规则描述无穷多字符串的集合自然语言描述(如:英语语法)
2、;严格的形式规则描述(如:C语言文法、Pascal 语言文法)-形式文法,形式语言,2023年10月31日星期二,南京航空航天大学计算机学院 胡军,4,BNF(Backus-Naur Form),例2.1 在类PasCal语言中,是用下述一组规则定义的::=:=IFTHENElSE:=WHILEDO:=BEGINEND:=;:=:=:=:=|=:=|():=+|-|*|/:=0|1|2|3|4|5|6|7|8|9:=a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z,2023年10月31日星期二,南京航空航天大学计算机学院 胡军,5,问题的提
3、出,例2.2 根据例2.1中的各规则,下述的字符串 WHILE x5 DO x:=(x+2)是一个合法的语句;因为:整个符合的定义结构;x5是的一种;x:=(x+1)是的一种(从而也是的一种);,2023年10月31日星期二,南京航空航天大学计算机学院 胡军,6,语法树(分析树,Parser Tree),2023年10月31日星期二,南京航空航天大学计算机学院 胡军,7,问题的提出,例2.3 用下述语法规则定义英语中的句子。thea applecatman eatssingsruns,the apple runs 语法/语义,2023年10月31日星期二,南京航空航天大学计算机学院 胡军,8,
4、2.2 形式文法与形式语言,定义2.1 一个文法G是一个四元组 G=(V,T,P,S),其中:V:是变元(Variable,Nonterminal)的有限集。T:是终结符(Terminal)的有限集。P:是产生式(Production)的有限集,其中每个产生式都是的形式,其中(VT)+,且其中至少有一个V中的符号,(VT)*。称为产生式的左部,称为产生式的右部。SV,称为文法G的开始符号。(S很重要,决定这组规则最终要定义什么,考虑例2.3中的和)例2.4:G1=(A,B,0,1,A0B,B1B,B0,A)。G2=(A,B,C,a,b,C,AaBC,Bb,CCC,C,A)。G3=(L,M,N,
5、0,1,2,M0LN,L1,0L2,LN12,N0,M)。,2023年10月31日星期二,南京航空航天大学计算机学院 胡军,9,文法表示方法的约定,凡有关文法的例子,都遵循下述的约定:大写拉丁字母A,B,C,D,E和S等等表示变元,除非另做说明,S表示开始符号。小写拉丁字母a,b,c,d,e,数字等等表示终结符。小写拉丁字母u,v,w,x,y,z等等表示终结符串。小写希腊字母,等等表示变元和终结符共同组成的串。另外还约定,同一个文法中如果有若干个左部相同而右部不同的产生式,如:1,2,n则可以缩写为:1|2|n在上述约定下,写一个文法时,只写出它的产生式集合就可以了.,2023年10月31日星
6、期二,南京航空航天大学计算机学院 胡军,10,字符串的推导 与 归约,定义2.2 给出文法 G=(V,T,P,S),我们定义两个字符串之间的一个关系“”:若=123,=13,并且2是P中的一个产生式,则有,此时称由直接推导出。根据第一章关于集合上关系的闭包的定义,我们也可将 扩充为,将 称为由推导出。若有S,则称为句型,当,则称为句子。对应于推导,还有一个重要的概念,称为“归约”。其定义是:如果 是由到的推导,则反过来称归约到,记作。,2023年10月31日星期二,南京航空航天大学计算机学院 胡军,11,字符串的推导 与 规约,例2.7 对于例2.6中给出的文法G,我们有:S 0A1 00A1
7、1 000A111 000111第一步直接推导用的是第(1)个产生式,第二步直接推导用的是第(2)个产生式,第三步直接推导还是用第(2)个产生式,最后一步直接推导用的是第(3)个产生式。总起来我们也可以写为S 000111。在这个推导中,0A1,00A11,000A111,000111都是句型,而000111又是句子。在今后写推导式子的时候,若所指的文法是明确无误的,则可将记号 或 中的G省略,只写 或 即可。另外,如果经过i步的直接推导到,就可写。,2023年10月31日星期二,南京航空航天大学计算机学院 胡军,12,形式文法与形式语言,定义2.3 给出文法 G=(V,T,P,S),它所产生
8、的语言记作(G),由下述集合定义:L(G)=|S,并且*。换句话说,文法G产生的语言(G),就是由G中开始符号S推导出来的全体终结符号串所构成的集合,也就是句子的集合。,2023年10月31日星期二,南京航空航天大学计算机学院 胡军,13,文法 语言,例2.8 给出文法G,它有两个产生式:SaSbSab则该文法产生的语言(G)=an bnn1。这是根据(G)的定义,考虑从S的推导,若先用G中第二个产生式,则S ab,就不能再往下推导了,此时相当于语言中1的情况。若从S出发,先用第一个产生式-1次,即S aSb aaSbb an-1S bn-1,最后再使用第二个产生式一次,得到S ab,这个推导
9、对于任何1都是对的。再加上=1的情况,即可得到L(G)an bnn1。,2023年10月31日星期二,南京航空航天大学计算机学院 胡军,14,文法语言,例2.9给出文法G,它的产生式是:SaBbAAabAAaSBbaBBbS(G)是由相等个数a和b组成的(次序不限)所有串的集合,加以证明。为了证明最终的结论,要证明以下三个互相关联的命题。S,当且仅当中包含相等个数的a和b。A,当且仅当中a的个数比b的个数多1。B,当且仅当中b的个数比a的个数多1。,2023年10月31日星期二,南京航空航天大学计算机学院 胡军,15,文法语言,下面我们用关于w长度的归纳法(多重归纳法)来证明上述三个命题。归纳
10、基础w1。命题(2),(3)显然是对的,因为只能有A a,B b,用其他产生式时都将推导出长度大于1的串。对于命题(1),因为在w1这个大前提下,一方面不可能有S w,另一方面中也不可能包含相等个数的a和b,即“当且仅当”的两个方面都是假的,故命题(1)自然成立。归纳步骤假设对于所有长度不超过k-1的串,命题(1),(2),(3)成立,现在要证当wk时(k2),命题(1),(2),(3)也成立。,2023年10月31日星期二,南京航空航天大学计算机学院 胡军,16,文法语言,先证命题(1)。如果S,那么推导的第一步必然是S aB或S bA。对于第一种情形,必然有aw1,且B w1,因为w1k1
11、,则根据归纳法假设,它包含b的个数比a的个数多1(命题(2),因此包含a的个数与b的个数相等。对于S bA的情形,证明完全类似。反之,如果wk,且w包含相等个数的a和b,要证S w。考虑w的第一个符号只有a或b两种情况,若是a,则waw1,且w1k1。由于w1中包含b的个数比a的个数多1,根据归纳法假设,必有B w1(命题(3)。此时使S的第一次直接推导为S aB,然后将B推导到1,最后得到S aw1w。对于w以b开始的情况,可以完全类似地证明。考虑再证明命题(2)和(3)。,2023年10月31日星期二,南京航空航天大学计算机学院 胡军,17,语言文法,例2.10 给出语言 a1,找出产生它
12、的文法。a,aa,aaa,它是一个无限集。因此必须先产生出一个a来,我们首先用产生式Sa来实现。因为是无限集,必须用递归的方法,以一个a为基础,不断地添加一个a。即再用一个产生式SaS,与第一个产生式合起来,整个文法就是:SaSaS当然,产生的文法不是唯一的,我们也可以用以下两个产生式SaSSa还可以用文法SaSS,2023年10月31日星期二,南京航空航天大学计算机学院 胡军,18,语言文法,例2.11 构造一个文法,使其能产生语言a,b*。w是由a和b以任意次序组成的串(包括空串),w是w的逆转,ww是由偶数个a,b组成且由中心开始左右对称的串,如abba,baaaab,aabaabaa等
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 形式语言 自动机 文法 一般 理论
链接地址:https://www.31ppt.com/p-6437767.html