编译原理与技术讲义-第10章.ppt
《编译原理与技术讲义-第10章.ppt》由会员分享,可在线阅读,更多相关《编译原理与技术讲义-第10章.ppt(43页珍藏版)》请在三一办公上搜索。
1、青岛大学信息工程学院,编译原理与技术,第10章 目标代码生成,编译原理与技术,2,主要内容,代码生成器设计的基本问题 虚拟计算机模型 语法制导的目标代码生成 基本块和待用信息 一个简单代码生成器代码生成技术小结,编译原理与技术,3,10.1 代码生成器设计的基本问题,代码生成在整个编译过程的位置,符号表,代码生成,中间代码生成与优化,语法树,目标程序,中间代码,中间代码,语义分析,中间代码,编译原理与技术,4,10.1 代码生成器设计的基本问题,目标程序 绝对机器代码,程序所有的内存地址,特别是程序的起始地址,在编译时都已经固定。这种代码的优点是装入机器后就可以立即执行,对于小程序可以快速编译
2、和运行。可重定位机器代码(可重定位目标模块),代码装入内存的起始地址可以任意改变。一组可重定位的若干目标模块,经过连接和装配后才可以运行。尽管这些工作增加了程序运行的代价,但是,可重定位机器代码的优点是灵活性。这种技术允许程序分模块编写,独立地编译成目标模块,并且从目标模块库中调用其它已经编译好的模块,便于程序开发。通常,可重定位机器代码中包含可重定位信息和连接信息。如果目标代码是汇编语言程序,还需要汇编后才能运行。只要地址可以由偏移址及符号表中的其它信息计算得到,代码生成器就可以产生程序中名字的绝对地址或可重定位地址。这样生成代码的好处是不用生成二进制的机器代码,而是产生符号指令并用宏机制来
3、帮助产生机器代码,使得代码生成过程变得容易。为了可读性,本章采用汇编语言作为目标语言。,编译原理与技术,5,10.1 代码生成器设计的基本问题,指令选择一个编译程序可以看成是一个转换系统,它把源程序转换成等价的目标代码,也就是说,对源语言种各种语言结构,依据语义确定相应的目标代码结构,即确定源语言于目标语言之间的对应关系,确保正确实现语义。显然,能否建立这样的关系直接影响到编译程序的质量。目标机器指令系统的性质决定了指令选择的难以程度,指令系统的一致性和完备性直接影响到这种对应关系的建立。如果目标机器能一致地支持各种数据类型和寻址方式,不需特别处理例外,这种对应关系的建立就容易得多。指令执行速
4、度和机器特点对产生目标代码的质量也十分重要。显然,如果指令集合丰富的目标机器对于某种操作可提供集中处理的时候,应该选择效率高、执行速度快的一种。,编译原理与技术,6,10.1 代码生成器设计的基本问题,寄存器选择 计算机存储单元之间通常都是通过寄存器联系。寄存器可以保存计算的中间结果,而且运算对象在寄存器的指令一般都比运算对象在内存的指令要短且运算的快。因此,充分合理地利用寄存器对生成高质量的代码十分重要。对于寄存器的使用,应该考虑程序中的哪些变量驻留在寄存器中、驻留多长时间。进一步,哪个变量驻留在哪个寄存器。这些问题可以划分成两个子问题:在寄存器分配期间,为程序的某一点选择驻留在寄存器中的一
5、组变量;在随后的寄存器指派阶段,选择变量要驻留的具体寄存器。选择最优的寄存器指派方案极其困难,从数学以上讲,这是一个NP完全问题。如果考虑到目标机器的硬件、操作系统对寄存器使用的一些要求时,这个问题就变得更加复杂。,编译原理与技术,7,10.1 代码生成器设计的基本问题,计算顺序的选择计算执行的顺序会影响目标代码的质量。改变运算的执行顺序可以减少需要用来保存中间结果的寄存器的个数,从而提高代码的效率。计算顺序最优选择也是一个非常困难的问题,一个NP完全问题。本书不讨论求值顺序问题,简单地就按照源程序或中间代码生成的顺序生成目标代码。,编译原理与技术,8,10.2 虚拟计算机模型,作为目标代码生
6、成阶段地址分配的依据 这个目标计算机模型具有n个通用寄存器R0,R1,Rn-1,它们既可以作为累加器,也可以作为变址器。假设目标机器按字节编址,4个字接组成一个字。我们用op表示运算符,用字母M表示内存单元,用字母C表示常量,用星号*表示间址方式存取。这台机器指令的一般形式为操作码 op 源数据域,目的数据域的二地址指令,表示源数据域和目的据域经过op运算以后的结果存到目的数据域。,编译原理与技术,9,10.2 虚拟计算机模型,指令按照地址模式分为四类,见表10.1,如果op是一元运算符,则指令“op M,Ri”的含义为:op(M)Ri,其余类型可以类推。上述指令中的运算符(操作码op)包括一
7、般计算机上常见的一些运算符,如加法ADD、减法SUB、负号NEG、乘法MUL、除法DIV、加1 INC、减1 DEC以及逻辑运算AND、NOT、OR等等。,编译原理与技术,10,10.2 虚拟计算机模型,当用作源或目的时,内存单元M和寄存器R都代表自身,例如,指令MOV R1,M采用直接地址寻址方式,将寄存器R1的内容存入内存单元M。MOV 4(R1),M采用变址寻址方式,把寄存器R1的偏移4的单元的内容存入内存单元M,即表中(4+R1)M。表中的间接变址寻址方式用前缀表示。例如,指令MOV 4(R1),R2把地址(4+(R1)中内容所指单元的内容装入寄存器R2中。常数用前缀#表示,下面的指令
8、采用立即数寻址方式,把常数10装入寄存器R1:MOV#10,R1,编译原理与技术,11,10.3 语法制导的目标代码生成,利用属性文法和语法制导技术,直接产生目标代码。基本原理和技术同第9章介绍的语法制导的中间代码翻译类似,只是产生的目标语言是机器指令。本节只讨论如何用翻译模式把源程序语言的简单赋值语句和表达式翻译成目标代码,文法如下:S id:=EE E1+E2|E1 E2|E1|(E1)|idB B1 and B2|B1 or B2|not B1|(B1)|id1 relop id2|true|false为了简单起见,这个算术表达式E只有加法、乘法与取负运算,不包含数组、记录等复杂的结构的
9、访问,布尔表达式B只包括了三个逻辑运算符和关系运算符。文法表达式文法是二义性的,解决文法二义性的原则采用通常意义的优先级和结合性。下面的翻译模式把目标代码写在了文法的属性code中,所使用的函数、变量和属性等与第9章的相同。,编译原理与技术,12,10.3 语法制导的目标代码生成,(1)S id:=Ep:=lookup(id.name);if p=nil then error else S.code:=E.code|gencode(MOV,E.place,p)(2)E E1+E2E.place:=newtemp;E.code:=E1.code|E2.code|gencode(MOV,E1.pl
10、ace,E.place)|gencode(ADD,E2.place,E.place);(3)E E1*E2E.place:=newtemp;E.code:=E1.code|E2.code|gencode(MOV,E1.place,E.place)|gencode(MUL,E2.place,E.place);,编译原理与技术,13,10.3 语法制导的目标代码生成,(4)E E1E.place:=newtemp;E.code:=E1.code|gencode(MOV,E1.place,E.place);gencode(NEG,E.place);(5)E(E1)E.place:=E1.place;
11、E.code:=E1.code;(6)E idp:=lookup(id.name);if p=nil then error else E.place:=p;E.code:=;,编译原理与技术,14,10.3 语法制导的目标代码生成,在下面布尔表达式的翻译中,我们对布尔表达式的求值翻译采用了短路法。其中J|relop.op表示各种条件的转移指令(表10.2)。(7)B B1 and B2B1.true:=newlabel;B1.false:=B.false;B2.true:=B.true;B2.false:=B.false;B.code:=B1.code|gencode(B1.true,:)|B
12、2.code(8)B B1 or B2B1.true:=B.true;B1.false:=newlabel;B2.true:=B.true;B2.false:=B.false;B.code:=B1.code|gencode(B1.false,:)|B2.code(9)B B1B1.true:=B.false;B2.false:=B.true;B.code:=B1.code,编译原理与技术,15,10.3 语法制导的目标代码生成,(10)B(B1)B1.true:=B.true;B2.false:=B.false;B.code:=B1.code;(11)B id1 relop id2 t:=ne
13、wtemp;B.code:=gencode(MOV,id1.place,t)|gencode(CMP,t,id2.place)|gencode(CJ|relop.op,B.true)|gencode(J,B.false)(12)B truegencode(J,B.true)(13)B falsegencode(J,B.false),编译原理与技术,16,10.3 语法制导的目标代码生成,例10.1 把布尔表达式ad翻译成目标代码。按照上述翻译模式得到的机器指令如下:MOV a,t1CMPt2,bCJB.trueJB.false其中B.true和B.false需要应用这个布尔条件的语句确定。,编
14、译原理与技术,17,10.3 语法制导的目标代码生成,本节介绍的翻译技术可以应用在简单语言的编译器中,不适合许多大型实际的程序设计语言。主要原因包括:(1)从语义分析直接生成目标代码有许多局限性,例如,由于目标代码于机器特性紧密相关,不利于代码的移植和优化,更好的策略是先产生某种直接代码,然后再翻译成目标指令序列;(2)在上面的翻译模式中,多处用到了产生临时变量的函数newtemp,没有充分考虑目标机器体系结构中的寄存器以及变量值的使用关系,而且过多的临时变量名还会造成存储分配与寄存器分配的问题。,编译原理与技术,18,10.4 基本块和待用信息,基本块及其构造 对于给定的程序,我们通常把它划
15、分为一系列的基本块,根据程序的控制流把这些基本块连接起来,形成程序流图。在逐步完成各个基本块的代码生成之后,就生成了整个程序的目标代码。基本块是指程序中一顺序执行的语句序列,其中只有一个入口语句和一个出口语句。基本块运行时只能从其入口语句进入,从出口语句退出。例如,下面的三地址代码组成了一个基本块:t 1:=a*at2:=a*bt3:=a*t2t4:=t1*t3t5:=t4+t2,编译原理与技术,19,10.4 基本块和待用信息,算法10.1 划分基本块输入:三地址语句序列输出:基本块列表,每个三地址语句仅在基本块中。(1)找出三地址代码中各个基本块的入口语句,它们是:程序的第一个语句,或者条
16、件语句活无条件语句的转移目标语句,或者紧跟在条件语句之后的语句。(2)对每一个入口语句,它所在的基本块就是由它开始到下一个入口语句之前、或者到一转移语句之前、或到程序结束的所有语句。凡是未被纳入某一基本块的语句,都是程序控制流无法到达的语句,因而也是不会被执行的语句,可以把它们删除。,编译原理与技术,20,10.4 基本块和待用信息,例 10.2:考虑下面计算长度为20的两个向量的点积的程序段,如图10.2。begin prod:=0;index:=;do begin prod:=prod+aindex*bindex;index:=index+1;end while index=10;end
17、图10.2 计算点积的程序,在虚拟机器上执行这个计算的三地址代码序列如图10.3。(1)prod:=0(2)index:=1t1:=4*index/*字长是4个字节*/(4)t2:=a t1/*计算aindex*/(5)t3:=4*index(6)t4:=b t1/*计算bindex*(7)t5:=t3*t4(8)t6:=prod+t5(9)prod:=t6(10)t7:=index+1(11)index:=t7(12)if index=20 goto(3),编译原理与技术,21,10.4 基本块和待用信息,我们运用算法10.1来决定图10.3的基本块。按照算法的规则语句(1)是入口语句,按照
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 编译 原理 技术 讲义 10
链接地址:https://www.31ppt.com/p-6599811.html