第3章 文法和语言ppt课件.ppt
《第3章 文法和语言ppt课件.ppt》由会员分享,可在线阅读,更多相关《第3章 文法和语言ppt课件.ppt(62页珍藏版)》请在三一办公上搜索。
1、第3章:文法和语言的概念和表示,3.0 概述3.1 形式语言基础3.2 文法的直观理解3.3 文法和语言的定义3.4 文法的类型3.5 语法树与二义性3.6 句型的分析,3.0 概述,用高级语言编程比用低级语言方便,但要解决两个问题:(1)计算机怎样懂得高级语言程序,这就需要一个翻译程序实现从源程序到目 标程序的转换。(2)用什么方法来精确定义高级语言,即怎样精确描述高级语言。要构造一个编译程序,应深刻理解被编译的源语言的结构(即词法和语法)及其含义(即语义),同时要弄清源语言的语法规则和语义规则是采用什么理论或什么方法来描述的。,本章目的 为语言的语法描述寻求工具,该工具要对程序设计语言给出
2、精确无二义的语法描述。(严谨、简洁、易读)形式工具-形式语言抽象地定义为一个数学系统。“形式”-:语言的所有规则只以符号串能出现的方式来陈述。,语言概述,研究程序设计语言 每个程序构成的规律 每个程序的含义 每个程序和使用者的关系语言研究的三个方面 语法 Syntax 语义 Semantics 语用 Pragmatics,语法 表示构成语言句子的各个记号之间的组合规律。语义 表示各个记号的特定含义。(各个记号和记号所表示的对象之间的关系)语用 表示在各个记号所出现的行为中,它们的来源、使用和影响。,每种语言具有两个可开始的特性,即语言的形式和该形式相关联的意义。语言的实例若在语法上是正确的,其
3、相关联的意义可以从两个观点来看,其一是该句子的创立者所想要表示的意义,另一是接收者所检验到的意义。这两个意义并非总是一样的,前者称为语言的语义,后者是其语用意义。幽默、双关语和谜语就是利用这两方面意义间的差异。,如果不考虑语义和语用,即只从语法这一侧面来看语言,这种意义下的语言称作形式语言。形式语言抽象地定义为一个数学系统。“形式”是指这样的事实:语言的所有规则只以什麽符号串能出现的方式来陈述。形式语言理论是对符号串集合的表示法、结构及其特性的研究。是程序设计语言语法分析研究的基础。,任何语言均可看作一个集合。这个集合中的每个元素都是在一定符号集(字母表)上的一个符号串。对于自然语言来说,它们
4、是定义在某个字母表上的句子的集合。对于程序语言来说,它们也是定义在某个字母表上的句子的集合。这里的句子,就是一个源程序。通常,源程序是由关键字、标识符、常数、运算符以及一些界限符组成。这些语法成分统称为单词或单词符号。单词符号是语言中具有独立意义的最基本单位。语言的单词符号是由词法规则所确定的,即词法规则规定了单词符号的形成规则。,当我们表述一种语言时,无非是要说明这种语言的句子,如果语言只含有穷多个句子,则只需列出句子的有穷集就行了,但对于含有无穷句子的语言来讲,就存在着如何给出它的有穷表示的问题。以自然语言为例,人们无法列出全部句子,但是人们可以给出一些规则,用这些规则来说明(或者定义)句
5、子的组成结构,比如汉语句子可以是由主语后随谓语而成,构成谓语的是动词和直接宾语。,“我是大学生”。是汉语的一个句子 用语法来描述:,句子=主语谓语主语=代词名词代词=我你他名词=王明大学生工人英语谓语=动词直接宾语动词=是学习直接宾语=代词名词,有了一组规则以后,按照如下方式用它们导出句子:开始去找=左端的带有句子的规则并把它由=右端的符号串代替,这个动作表示成:句子 主语谓语,然后在得到的串主语谓语中,选取主语或谓语,再用相应规则的=右端代替之。比如,选取了主语,并采用规则主语=代词,那么得到:主语谓语 代词谓语,重复做下去,句子:“我是大学生”的全部动作过程是:句子 主语谓语 代词谓语 我
6、谓语 我动词直接宾语 我是直接宾语 我是名词 我是大学生,“我是大学生”的构成符合上述规则,而“我大学生是”不符合上述规则,我们说它不是句子。这些规则成为我们判别句子结构合法与否的依据,换句话说,这些规则看成是一种元语言,用它描述汉语。这里仅仅涉及汉语句子的结构描述。其中一种描述元语言称为文法。,3.1 形式语言基础,基本概念:一、字母表和符号串1.字母表:符号的非空有限集合 例:=a,b,c2.符号:字母表中的元素 例:a,b,c3.符号串:符号的有穷序列 例:a,aa,ac,abc,.特别地,空符号串:无任何符号的符号串(),符号串的形式定义 有字母表,定义:(1)是上的符号串;(2)若x
7、是上的符号串,且a,则ax或xa是上的符号串;(3)y是上的符号串,iff(当且仅当)y可由(1)和(2)产生。,4.符号串集合:由符号串构成的集合。,二、符号串和符号串集合的运算,5.符号串相等:若x、y是集合上的两个符号串,则xyiff(当且仅当)组成x的每一个符号和组成y的每一个符号依次相等。6.符号串的长度:x为符号串,其长度|x|等于组成该符 号串的符号个数。例:xSTV,|x|=3 特别地,|=0,例:Aa,b,B=c,d,AB=?,8.符号串集合的乘积运算:令A、B为符号串集合,定义 AB xy|xA,yB,ac,ad,bc,bd 因为xxx,所以A=A=A,7.符号串的联接:若
8、x、y是定义在是上的符号串,且xXY,yYX,则x和y的联接 xyXYYX也是上的符号串。注意:一般xyyx,而xxx,9.方幂运算:符号串集合的方幂 符号串的方幂 有任一符号串集合A,定义:有任一符号串X,定义:A0=,X0=A1=A,X1=XA2=AA,X2=XXA3=AAA,X3=XXX AnAn-1A=AAn-1 Xn=XX X A A A n个 n个其中:n0,10.符号串集合的闭包运算:设A是符号串集合,定义 A=A1 A2 A3 An 称为集合A的正则闭包。A*=A0 A1 A2 A3 An=A0 A 称为集合A的星闭包。,例:A=x,y A?A*?,x,y,xx,xy,yx,y
9、y,xxx,xxy,xyx,xyy,A1 A2 A3,x,y,xx,xy,yx,yy,xxx,xxy,xyx,xyy,A0 A1 A2 A3,为什么对符号、符号串、符号串集合以及它们的运算感兴趣?若A为某语言的基本字符集 Aa,b,z,0,1,9,+,_/,(,),=B为单词集 B=begin,end,if,then,else,for,则B A*。语言的句子是定义在B上的符号串。若令C为句子集合,则C B*,程序 C,3.2文法的直观理解,1.什么是文法:文法是对语言结构的定义与描述。即从形式上用于描述和规定语言结构的称为“文法”(或称为“语法”)。,例:有一句子:“我是大学生”。这是一个在语
10、法、语义上都正确定句子,该句子的结构(称为语法结构)是由它的语法决定的。在本例中它为“主谓结构”。,如何定义句子的合法性?有穷语言无穷语言,2.语法规则:我们通过建立一组规则(产生式),来描述句子的语法结构。规定用“:=”表示“由组成”。,:=:=|:=你|我|他:=王民|大学生|工人|英语:=:=是|学习:=|,由产生式推导句子:,=这种推导一直进行下去,直到所有带的符号都由终结符号替代为止。,有了一组产生式之后,可以按照一定的方式用它们去推导或产生句子。推导方法:从一个要开始的符号开始推导,即用相应产生式的右部来替代产生式的左部,每次仅用一条产生式去进行推导。,我,我,我是,我是,我是大学
11、生,:=:=|:=你|我|他:=王民|大学生|工人|英语:=:=是|学习:=|,推导方法:从一个要开始的符号开始推导,即用相应产生式的右部来替代产生式的左部,每次仅用一条产生式去进行推导。,例:给定一组语法规则,考察一个句子:“我是大学生”的推导过程。,例:有一英语句子:The big elephant ate the peanut.:=:=:=the:=big:=elephant:=:=ate:=:=peanut,=,=,=the,=the big,=the big elephant,=the big elephant,=the big elephant ate,=the big eleph
12、ant ate,=the big elephant ate the,=the big elephant ate the peanut,:=:=:=the:=big:=elephant|peanut:=:=ate:=,The big elephant ate the peanut.,说明:(1)有若干语法成分同时存在时,我们总是从最左的语法成 分进行推导,这称之为最左推导,类似的有最右推导(一般推 导)。(2)从一组产生式可推出不同的句子,如以上产生式还可推出“大象吃象”、“大花生吃象”、“大花生吃花生”等句子,它们 在语法上都正确,但在语义上都不正确。,所谓文法是在形式上对句子结构的定义与描述
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第3章 文法和语言ppt课件 文法 语言 ppt 课件

链接地址:https://www.31ppt.com/p-2133328.html