形式语言与自动机理论第四章(蒋宗礼)ppt课件.ppt
《形式语言与自动机理论第四章(蒋宗礼)ppt课件.ppt》由会员分享,可在线阅读,更多相关《形式语言与自动机理论第四章(蒋宗礼)ppt课件.ppt(64页珍藏版)》请在三一办公上搜索。
1、形式语言与自动机理论Formal Languages and Automata Theory,蒋宗礼,课程目的和基本要求,课程性质技术基础 基础知识要求 数学分析(或者高等数学),离散数学 主要特点 抽象和形式化 理论证明和构造性 基本模型的建立与性质,课程目的和基本要求,本专业人员4种基本的专业能力计算思维能力算法的设计与分析能力程序设计和实现能力计算机软硬件系统的认知、分析、设计与应用能力计算思维能力逻辑思维能力和抽象思维能力构造模型对问题进行形式化描述理解和处理形式模型,课程目的和基本要求,知识掌握正则语言、下文无关语言的文法、识别模型及其基本性质、图灵机的基本知识。能力培养学生的形式化
2、描述和抽象思维能力。使学生了解和初步掌握“问题、形式化描述、自动化(计算机化)”这一最典型的计算机问题求解思路。,主要内容,语言的文法描述。RLRG、 FA、RE、RL的性质 。CFLCFG(CNF、GNF)、PDA、CFL的性质。 TM基本TM、构造技术、TM的修改。CSLCSG、LBA。,教材及主要参考书目,蒋宗礼,姜守旭. 形式语言与自动机理论. 北京:清华大学出版社,2003年 John E Hopcroft, Rajeev Motwani, Jeffrey D Ullman. Introduction to Automata Theory, Languages, and Comput
3、ation (2nd Edition). Addison-Wesley Publishing Company, 2001 John E Hopcroft, Jeffrey D Ullman. Introduction to Automata Theory, Languages, and Computation. Addison-Wesley Publishing Company, 1979,第4章 正则表达式,正则文法擅长语言的产生,有穷状态自动机擅长语言的识别。本章讨论正则语言的正则表达式描述。它在对正则语言的表达上具有特殊的优势,为正则语言的计算机处理提供了方便条件。简洁、更接近语言的集合
4、表示和语言的计算机表示等。,第4章 正则表达式,主要内容典型RE的构造。与RE等价FA的构造方法。与DFA等价的RE的构造。重点RE的概念。RE与DFA的等价性。难点:RE与DFA的等价性证明。,4. 启示,产生语言anbmck|n,m,k1aicnbxam|i0,n1,m2,x为d和e组成的串 的正则文法为AaA|aB|cEBbB|bCCcC|cE cE|bFFdF|eF|aHHaH|a,4. 启示,接受此语言的NFA M,4. 启示,计算集合 set(q)set(A)=an|n0=a* set(B)= set(A)abn|n0 =anabm|m,n0 =a*ab*=a+b*set(C)=
5、set(B)bc* =a*ab*bc*=a+b+c*set(D)= set(C) c=a+b+c*c =a+b+c+,4. 启示,set(E)= set(A)cc* =a*cc*=a*c+set(F)= set(E)bd,e*=a*c+bd,e*set(H)= set(F)aa*=a*c+d,e*aa* =a*c+d,e*a+set(I)= set(H)a=a*c+d,e*a+aL(M)= set(D)set(H) = a+b+c+a*c+d,e*a+a,4. 启示,根据集合运算的定义,d,e=de。从而,d,e*=(de)*。这样可以将L(M)写成如下形式:L(M)= a+b+c+a*c+(
6、de)*a+a 记作:a+b+c+a*c+(d+e)*a+a= aa*bb*cc*+a*cc*(d+e)* aaa*,4.2 RE的形式定义,正则表达式(regular expression,RE) 是上的RE,它表示语言; 是上的RE,它表示语言; 对于a,a是上的RE,它表示语言a;,4.2 RE的形式定义, 如果r和s分别是上表示语言R和S的RE,则: r与s的“和” (r+s)是上的RE,(r+s)表达的语言为RS; r与s的“乘积” (rs)是上的RE,(rs)表达的语言为RS; r的克林闭包(r*)是上的RE,(r*)表达的语言为R*。 只有满足、的才是上的RE。,4.2 RE的形
7、式定义,例 4-1 设=0,1 0,表示语言0; 1,表示语言1; (0+1),表示语言0,1; (01),表示语言01; (0+1)*),表示语言0,1*; (00)(00)*),表示语言0000*;,4.2 RE的形式定义, (0+1)*)(0+1)(0+1)*),表示语言0,1+; (0+1)*)000)(0+1)*),表示0,1上的至少含有3个连续0的串组成的语言; (0+1)*)0)1),表示所有以01结尾的0、1字符串组成的语言; (1(0+1)*)0),表示所有以1开头,并且以0结尾的0、1字符串组成的语言。,4.2 RE的形式定义,约定 r的正闭包r+表示r与(r*)的乘积以及
8、(r*)与r的乘积: r+=(r(r*)=(r*)r) 闭包运算的优先级最高,乘运算的优先级次之,加运算“+”的优先级最低。所以,在意义明确时,可以省略其中某些括号。 (0+1)*)000)(0+1)*)=(0+1)*000(0+1)*,4.2 RE的形式定义,(0+1)*)(0+1)(0+1)*)=(0+1)*(0+1)(0+1)* 在意义明确时,RE r表示的语言记为L(r),也可以直接地记为r。 加、乘、闭包运算均执行左结合规则。,4.2 RE的形式定义,相等(equivalence)r、s是字母表上的一个RE,如果L(r)=L(s),则称r与s相等,记作r=s 。相等也称为等价。几个基
9、本结论 结合律:(rs)t=r(st) (r+s)+t=r+(s+t) 分配律:r(s+t)=rs+rt (s+t)r=sr+tr,4.2 RE的形式定义, 交换律:r+s=s+r。 幂等律:r+r=r。 加法运算零元素:r+=r。 乘法运算单位元:r=r=r。 乘法运算零元素:r=r=。 L()=。 L()=。 L(a)=a。,4.2 RE的形式定义, L(rs)=L(r)L(s)。 L(r+s)=L(r)L(s)。 L(r*)=(L(r)* 。 L(*)=。 L(r+)*)=L(r*)。 L(r*)*)=L(r*)。 L(r*s*)*)=L(r+s)*)。 如果L(r) L(s),则r+s
10、=s。,4.2 RE的形式定义, L(rn)=(L(r)n 。 rnrm=rn+m 。一般地, r+r,(rs)n rnsn,rssr。幂 r是字母表上的RE,r的n次幂定义为 r0=。 rn=rn-1r。,4.2 RE的形式定义,例 4-2 设=0,100表示语言00;(0+1)*00(0+1)*表示所有的至少含两个连续0的0、1串组成的语言;(0+1)*1(0+1)9表示所有的倒数第10个字符为1的串组成的语言;,4.2 RE的形式定义,L(0+1)*011)=x|x是以011结尾的0、1串;L(0+1+2+)=0n1m2k|m,n,k1;L(0*1*2*)=0n1m2k|m,n,k0;L
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 形式语言与自动机理论 第四章蒋宗礼ppt课件 形式语言 自动机 理论 第四 蒋宗礼 ppt 课件
链接地址:https://www.31ppt.com/p-1935647.html