语言分析基础小.ppt
《语言分析基础小.ppt》由会员分享,可在线阅读,更多相关《语言分析基础小.ppt(34页珍藏版)》请在三一办公上搜索。
1、1,第二章 语言分析基础,2,语言分析基础,文法和语言概述字母表和符号串文法和语言的形式定义文法的类型上下文无关文法及其语法树句型的分析有关文法实用中的说明,3,语言是由句子组成的集合,是由一组符号所构成的集合 字母表上的一个语言是上的一些符号串的集合 字母表上的每个语言是*的一个子集,2.3 文法和语言的形式定义,文法是对语言结构的定义与描述。(或称为“语法”)。,:=“=”:=“+”|“*”:=“(”“)”|,4,1.语法规则:我们通过建立一组规则,来描述句子的语法结构。规定用“:=”或“=”或“-”表示“由组成”。,:=:=|:=你|我|他:=王民|大学生|工人|英语:=:=是|学习:=
2、|,2.3 文法和语言的形式定义,5,2.由规则推导句子:有了一组规则之后,可以按照一定的方式用它们去推导或产生句子。推导方法:从一个要识别的符号开始推导,即用相应规则的右部来替代规则的左部,每次仅用一条规则去进行推导。,=这种推导一直进行下去,直到所有带的符号都由终结符号替代为止。,2.3 文法和语言的形式定义,6,=,=,=我,=我,=我是,=我是,=我是大学生,:=:=|:=你|我|他:=王民|大学生|工人|英语:=:=是|学习:=|,推导方法:从一个要识别的符号开始推导,即用相应规则的右部来替代规则的左部,每次仅用一条规则去进行推导。,2.3 文法和语言的形式定义,我是大学生,7,例:
3、有一英语句子:The big elephant ate the peanut:=:=:=the:=big:=elephant:=:=ate:=:=peanut,2.3 文法和语言的形式定义,8,:=:=:=the:=big:=elephant|peanut:=:=ate:=,=,=,=the,=the big,=the big elephant,=the big elephant,=the big elephant ate,=the big elephant ate,=the big elephant ate the,=the big elephant ate the peanut,2.3 文
4、法和语言的形式定义,The big elephant ate the peanut,9,上述推导可写成=the big elephant ate the peanut,+,说明:(1)有若干语法成分同时存在时,我们总是从最左的语法成分进行推导,这称之为最左推导,类似有最右推导(规范推导)。(2)从一组规则可推出不同的句子,如以上规则还可推出“大象吃象”、“大花生吃象”、“大花生吃花生”等句子,它们在语法上都正确,但在语义上都不正确。,所谓文法是在形式上对句子结构的定义与描述,而未涉及语义问题。,2.3 文法和语言的形式定义,10,文法 GS=(VN,VT,P,S)VN:有穷非空的非终结符号集
5、VT:有穷非空的终结符号集,且VNVT=P:有穷非空产生式或规则的集合 S:开始符号(识别符号)SVN,S至少要在 一条规则中作为左部出现。,文法的形式定义,2.3 文法和语言的形式定义,11,终结符号(T)语言不可再分的基本符号,通常是一个语言的字母表。非终结符号(N)也称语法变量,它代表语法实体或语法范畴。,2.3 文法和语言的形式定义,VN VT称为文法的字母表,一般用V表示。,:或(VN VT)+且至少有一个非终结符,而(VN VT)*,例:Pa1,Pa2,Pan 缩写成:Pa1a2an,文法开始符号(S)一个特殊的非终结符,它就是语言的目标。规则(也称产生式或生成规则)是定义语法实体
6、的一种书写规则。,12,例:G=(VN,VT,P,S)VN=S,VT=0,1,P=S0S1,S01,S为开始符号。,例:G=(VN,VT,P,S)VN=,VT=a,b,c,x,y,z,0,1,9 P=a,z 0,9 S=,2.3 文法和语言的形式定义,13,G=(VN,VT,S,P),其中:VN=表达式VT=+,*,(,),iS=表达式P=表达式表达式+表达式 表达式表达式*表达式 表达式(表达式)表达式i,例:程序语言中只含+、*和()运算的算术表达式,用i表示变量或常数,其文法可以表示为:,2.3 文法和语言的形式定义,14,产生式左边符号构成集合VN,且 S VN,VN:代表程序的语法成
7、份,如“表达式”,它不会出现在程序中。VT:会出现在程序中,如 i+i,2.3 文法和语言的形式定义,15,终结符:一般用小写字母表示,如a、b、i 非终结符:一般用大写字母表示,如S、W、A 文法开始符S:第一条产生式的左部,或写成GS,2.3 文法和语言的形式定义,16,终结符集是输入字符集,它是构成单词的最基本元素,终结符集是经词法分析识别后的单词集,如变量i,运算符+、*和分界符(、),它们被视为语法分析中最基本元素。,描述词法规则的文法,GS:SL|SL|SD La|b|z D0|1|9,2.3 文法和语言的形式定义,17,文法的表示方法:,3.语法图,2.EBNF(扩展的巴科斯范式
8、),元符号:,:=,|,(,),1.BNF(巴科斯范式),元符号:,:=,|,2.3 文法和语言的形式定义,18,形式语言理论可以证明以下两点:(1)L(G)G1,G2,Gn;(2)G L(G);已知语言,构造文法,无形式化方法,更多是凭经验;已知文法,求语言,通过推导。,2.3 文法和语言的形式定义,文法应满足两点要求:语言的所有的句子都能由文法的开始符号推导得到;由开始符号推导出来的所有终结符号串都是语言的句子。,注意:一种语言可由不同的文法产生,但一个文法描述的语言却是唯一的!,19,一般采用“凑规则”的方法来构造语言的文法,步骤如下:1.找出语言的若干典型句子;2.分析句子的特点;3.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语言 分析 基础
链接地址:https://www.31ppt.com/p-6344986.html