《形式语言概论》PPT课件.ppt
《《形式语言概论》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《形式语言概论》PPT课件.ppt(44页珍藏版)》请在三一办公上搜索。
1、第2章形式语言概论,文法和语言形式化定义 文法的类型 语言和语法树 文法和语言的几点说明 分析方法简介 本章小结,形式语言理论:是指由数学方法研究自然语言和人工语言(程序设计语言)之语法理论,主要讨论了语言和文法的数学机制以及语言和文法的分类。,文法的直观概念,如果语言只含有有穷多个句子,则只需列出句子的有穷集就行了,但对于含有无穷句子的语言来讲,存在如何给出它的有穷表示的问题。虽然无法列出全部句子,但是可以给出一些规则,用这些规则来说明句子的组成结构,然后用它们去推导产生句子。,文法:是阐述语法的一个工具,“你是大学生”对“我是教师”对“我大学生是”错“我学习大学生”对,句子=主语谓语主语=
2、代词|名词代词=我|你|他名词=王明|大学生|教师|英语谓语=动词直接宾语动词=是|学习直接宾语=代词|,句子 主语谓语 代词谓语 我谓语 我动词直接宾语 我是名词 我是教师,推导:我是教师,例如,描述标识符的文法如下::=:=:=:=a|b|c|d|z:=0|1|2|3|4|5|6|7|8|9,字母表和符号串,字母表:是元素的非空有穷集合,用表示。字母表中的元素称为符号。例如:汉语的字母表中包括汉字、数字及标点符号等。PASCAL语言的字母表是由字母、数字、算符、保留字等组成。,符号串的长度:符号串中符号的个数。符号串x的长度记为|x|。如|ab012|=5。空符号串:不含任何符号的符号串,
3、记为。|=0。,符号串:符号的有穷序列称为符号串,如compiler,string等。,符号串的连接:设x和y是符号串,它们的连接xy是把y的符号写在x的符号之后得到的符号串。如:x=ab、y=123,则xy=ab123。显然,x=x=x。,符号串集合的乘积:两个符号串集合A和B的乘积定义为:AB=xy|xA且yB。特别地A=A=A。如:A=ab,c,B=d,efg,则AB=abd,abefg,cd,cefg。,符号串的方幂:设x为符号串,则xn=xxx(x连接n次)。特别有x0=。,符号串集合:若集合A中的一切元素都是某字母表上的符号串,则称A为该字母表上的符号串集合。,符号串集合的方幂:同
4、一符号串集合的乘积。如:A=a,bc,则A2=aa,abc,bca,bcbc A3=A2A=?,符号串集合的正闭包:符号串集合A正闭包A+=A1A2.An.即A+为集合A上所有符号串的集合。符号串集合的自反闭包:符号串集合A正闭包A*=A+=A+显然有 A+=AA*=A*A,文法,产生式:设VN,VT分别是非空有限的非终结符号集和终结符号集,令V=VNVT,VNVT=,一个产生式是一般形式为:A-,其中A VN,V*,A称为产生式的左部,称为产生式的右部。-表示为定义为 如果产生式集合中的产生式有共同的左部,如:A-,A-,则可将其简写为:A-|。,变量表,符号表,文法:文法G定义为四元组(V
5、N,VT,P,S)。其中:VN:非终结符号集。非终结符号代表某一类的记号,如“算术表达式”、“赋值句”等等。VT:终结符号集。终结符号代表不可再分的基本符号,如保留字、标识符、常数、运算符、界符等。VNVT=;V=VNVT称为文法G的词汇表。S:开始符号。开始符号是一个特殊的非终结符号,表示文法G所定义的最终的语法范畴。P:产生式的集合。产生式是定义语法范畴的一种书写格式,形式如下:其中,称为产生式左部,它必须是包含非终结符;称为产生式右部,它可以是终结符、非终结符或他们的组合。,例1:文法G=(VN,VT,P,S)VN=标识符,字母,数字VT=a,b,c,x,y,z,0,1,9P=a,z 0
6、,9 S=习惯上只将产生式写出。并有如下约定:1、第一条产生式的左部是开始符号;2、用尖括号括起的是非终结符,否则为终结符。或者大写字母表示非终结符,小写字母表示终结符;3、G可写成GS,其中S是开始符号;,文法例子,例2:无符号二进制数的描述文法 如下形式:1011.0101G=(VN,VT,P,B)VN=B,BiVT=0,1,.P=BBi|Bi.Bi Bi0|1|Bi 0|Bi 1,例3:设E代表“算术表达式”;i代表单个变量或常数;+、*、(、)是构成算术表达式的运算符和括号。定义由前面符号组成的单个变量或常量组成的算术表达式;若E是一个算术表达式,则E+E,E*E,(E)也是算术表达式
7、,写成文法形式:G=(VN,VT,P,S)VN=E VT=i,+,*,(,)P=Ei,E E+E,E E*E,E(E),思考:(i+i)是不是该文法定义的表达式?,文法的类型:语言学家乔姆斯基(Chomsky)把文法分成以下四种类型:,0型 短语文法1型 上下文有关文法2型 上下文无关文法3型 正规文法,文 法 类 型,逐 渐 增 加 限 制,0型文法:对任一产生式,都有(VNVT)+,(VNVT)*。至少含有一个非终结符。1型文法(上下有关文法):对任一产生式,都有|,仅仅 S除外。,1型文法又称为上下文有关文法,它具有如下形式:,除有可能S外,均有=1A2=12,其中1,2(VNVT)*,
8、AVN,(VNVT)+,只有A出现在1,2的上下文中,才允许用取代A。1型文法中,1=|=|,1型文法例:G=(VN,VT,P,S),其中VN=S,B,C,VT=a,b,c,P=SaSBC,SabC,CBBC,bBbb,bCbc,cCcc,S=aSBC=aabCBC=aabBCC=aabbCC=aabbcC=aabbcc,CBCACABABABC,2型文法(上下无关文法):除有可能S,对任一产生式A,都有AVN,(VNVT)+。2型文法左边是单个非终结符,右边是由终结符和非终结符组成的符号串。上下无关文法也称CFG文法(Context Free Grammar),2型文法例1:G=(VN,VT
9、,P,S),其中VN=S,T,VT=a,b,c,d,P=SaTd,TbT|cT|b|c 2型文法例2:G=(VN,VT,P,S),其中VN=S,VT=0,1,P=S0S1,S01,3型文法(正规文法):除S外,所有产生式的形式都为 AaB或Aa,其中A VN,B VN,a VT。正规文法是CFG文法的一个子集,正规文法例:G=(VN,VT,P,A),其中VN=A,B,C,D,VT=x,y,z,P=AxB|yC,BzB|y|yC,CxD,DyD|x,若 则称右线型文法,直接推导(定义2.3):设文法G=(VN,VT,P,S),A是文法G的产生式,若有,V*,使得U=A,w=,则说:U(应用规则A
10、)直接产生w 或说:w是U的直接推导 或说:w直接归约到U 记作 U w。特别地,当=时,A 例4:文法GS:S0S1,S01,其中VN=S,VT=0,1直接推导:0S10011(U=0S1,w=0011,使用规则S01,=0,=1)S 0S1(U=S,w=0S1,使用规则S0S1,=,=)0S100S11(U=0S1,w=00S11,使用规则S0S1,=0,=1),推导(定义2.4):存在v=0=1=n=w,(n0)则称w为v的一个推导,记为v u。另使用(定义2.5)v u 表示v u或 v=u,前面例子 G=(VN,VT,P,S)VN=E VT=i,+,*,(,)P=Ei,E E+E,E
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 形式语言概论 形式语言 概论 PPT 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5507626.html