【教学课件】第十章目标程序运行时的组织.ppt
第十章 目标程序运行时的组织,10.1 概述2数据表示10.3目标程序运行时的栈式存储组织10.4 参数传递10.5堆式存储组织的讨论,概述-代码生成解决语义gap,高级语言支持的概念Type value expressionVariable procedureFunction parameters,目标机支持的概念 bits bytes wordsRegistersStack addressRoutine(sub routine),概述,代码生成前如何安排目标机资源运行时组织的几个问题数据表示-如何在目标机中表示每个源语言类型的值表达式求值-如何组织表达式的计算存储分配-如何组织不同作用域变量的存储过程实现-如何以例程实现过程,函数,参数传递,概述,任务:编译程序对目标程序运行时的组织(设计运行环境和分配存储)如 通常存储区布局可为:,目标代码区 静态数据区 Stack heap,运行环境和存储分配设计分析,逻辑阶段:在目标代码生成前,作准备实质:关联(Binding)将源程序的文本 程序运行动作的实现 源文件中的名字N 运行时的存储S在语义学中,使用术语environment函数表示env:NS(N到S的映射),决定运行管理复杂程度的因素源语言本身,1.,允许的数据类型的多少,2,语言中允许的数据项是,静态确定,动态确定,3,程序结构,决定名字的作用域的规则和结构,A,段结构,B,过程定义不嵌套,只允许过程递归调用,C,分程序结构,分程序嵌套,过程定义嵌套,4存储类别的多少,GlobalStaticLocaldynamic,术语,静态:如果一个名字的性质通过说明语句或隐或显规则而定义,则称这种性质是“静态”确定的。动态:如果名字的性质只有在程序运行时才能知道,则称这种性质为“动态”确定的。,例 procedure A(m,n:integer);begin real z;array Bm:n;begin end;end;,数据表示各种数据对象的存储分配,数据对象的属性 name 名字,名称 type 类型 location 内存地址 value 值 component 成分,数据表示(固定长度,直接或间接表示),简单变量:char:1 byteintegers:2 or 4 bytesfloats:4 to 16 bytesbooleans:1 bit(but usually 1 byte)指针:unsigned integers一维数组:一块连续的存储区多维数组:一块连续的存储区,按行存放结构(记录):把所有域(field)存放在一块连续的存储区对象:类的实例变量象结构的域一样存放在一块连续的存储区,但方法(成员函数)不存在该对象里指令:,l,可变(动态)数组:若一个数组所需的存储空间的大小在编译时就已知道,则称它为确定数组,否则称为可变(动态)数组。数组内情向量:,:,编译将数组的有关信息记录在一些单元中,称为数组的,“内,情向量”,Al,1,:u,1,l,2,:u,2,l,n,:,u,n,l,1,u,1,l,2,u,2,:,:,type,a,(首地址),n C,目标程序运行时的存储组织,存储分配策略:简单的栈式分配方案 嵌套过程的栈式分配方案 分程序结构的存储分配方案,静态存储分配,动态存储分配栈式,堆式,l,术语-过程活动记录,AR,:,为说明方便,假定程序是由过程组成,过程区分为源文本,,运行时称作过程的激活。,一个过程的一次执行所需要的信息使用一个连续的存储区来,管理,这个区,(块)叫做一个活动记录或,frame,(,帧,),一般这个段要记录:,l,临时值,如计算表达式时的中间工作单元。,l,局部变量,(数据),l,保存运行过程前的状态,(返回地址,寄存器值),l,存取链,(可选),对于非局部量的引用。,l,控制链,(可选),指向调用者的活动记录,释放栈。,l,实参,(形式单元),l,返回值,(对函数),(有时可使用寄存器存放返回值),简单的栈式分配方案,程序结构特点:过程定义不嵌套,过程可递归调用,含可变数组;例:main 全局变量的说明proc Rend R;proc Q end Q;主程序执行语句 end main,嵌套过程语言的栈式分配方案,主要特点:(语言)一个过程可以引用包围它的任一外层过程所定义的标识符(如变量,数组或过程等)。(实现)一个过程可以引用它的任一外层过程的最新活动记录中的某些数据。,关键技术:解决对非局部量的引用(存取)。设法跟踪每个外层过程的最新活动记录AR的位置。跟踪办法:1.用静态链(如PL/0的SL)。2.用DISPLAY表。,const a=10;var b,c;procedure p;begin c:=b+a;end;begin read(b);while b#0 do begin call p;write(2*c);read(b);endend.,(0)jmp 0 8 转向主程序入口(1)jmp 0 2 转向过程p入口(2)int 0 3 过程p入口,为过程p开辟空间(3)lod 1 3 取变量b的值到栈顶(4)lit 0 10 取常数10到栈顶(5)opr 0 2 次栈顶与栈顶相加(6)sto 1 4 栈顶值送变量c中(7)opr 0 0 退栈并返回调用点(16)(8)int 0 5 主程序入口开辟5个栈空间(9)opr 0 16 从命令行读入值置于栈顶(10)sto 0 3 将栈顶值存入变量b中(11)lod 0 3 将变量b的值取至栈顶(12)lit 0 0 将常数值0进栈(13)opr 0 9 次栈顶与栈顶是否不等(14)jpc 0 24 等时转(24)(条件不满足转)(15)cal 0 2 调用过程p(16)lit 0 2 常数值2进栈(17)lod 0 4 将变量c的值取至栈顶(18)opr 0 4 次栈顶与栈顶相乘(2*c)(19)opr 0 14 栈顶值输出至屏幕(20)opr 0 15 换行(21)opr 0 16 从命令行读取值到栈顶(22)sto 0 3 栈顶值送变量b中(23)jmp 0 11 无条件转到循环入口(11)(24)opr 0 0 结束退栈,目标代码解释执行时数据栈的布局(运行栈的存储分配),每个过程的AR有3个联系单元:SL:静态链,指向定义该过程的直接外过程(或主程序)运行时最新数据段的基地址。DL:动态链,指向调用该过程前正在运行过 程的数据段基地址。RA:返回地址,记录调用该过程时目标程序的断点,即调用过程指令的下一条指令的地址。局部变量中间结果,目标代码的解释执行 运行栈S,M调用过程P,RA DL SL,b,.,t,t,b,P,M,解决对非局部量的引用(存取)用Display表,Display表-嵌套层次显示表当前激活过程的层次为K,它的Display表含有K+1个单元,依次存放着现行层,直接外层直至最外层的每一过程的最新活动记录的基地址,用Display表的方案,(1)主程序-(2)P-(3)Q-(4)R,P 的活动记录主程序的活动记录,d1d0,display,sp,top,主程序的活动记录,d0,sp,display,top,(1),(2),用Display表的方案,主程序-P-Q-R,R 的活动记录 Q 的活动记录 P 的活动记录主程序的活动记录,Q 的活动记录 P 的活动记录主程序的活动记录,display,d2d1d0,d1d0,display,sp,top,top,sp,(3),(4),DISPLAY表的维护和建立,DISPLAY表d 运行栈 0 主程活动记录地址 1 R活动记录地址,.,当过程的层次为n,它的 display为n+1个值。一个过程被调用时,从调用过程的DISPLAY表中自下向上抄录n个SP值,再加上本层的SP值。全局DISPLAY地址,分程序结构Procedure A(m,n);integer m,n;B1:begin real z;array Bm:n;B2:begin real d,e;L3:2 end;B4:begin array C1:m;1 B5:begin real e;L6:5 4 end;end;L8:end;,分程序结构的存储分配方案,处理分程序结构存储分配方案的一种简单办法是,把分程序看成“无名无参过 程”,它在哪里定义就在哪里被调用。因此,可以把处理过程的存储办法应用到处理分程序中。但这种做法是极为低效的。一则,每逢进入 一个分程序,就照样建立连接数据和DISPLAY表,这是不必要的。二则,当从内层分程序向外层转移时,可能同时要结束若干个分程序。,按照过程处理办法,意味着必须一层一层地通过“返回”来恢复所要到达的那个分程序的数据区,但不能直接到达。例如:如果有一个从第5层分程序转出到达第1层分程序的标号L,虽然在第5层分程序工作时知道L所属的层数,我们极易从DISPLAY中获得第1层分程序的活动记录基址(SP),但是怎么知道第1层分程序进入时的TOP呢?唯一的办法是从 5,4,3和2各层顺序退出。但这种办法是很浪费时间的。,为了解决上述问题,可采取两种措施。第一,对每个过程或分程序都建立有自己的栈顶指示器TOP,代替原来仅有过程的栈顶指示器,每个TOP的值保存在各自活动记录中。这样,上述的第二个问题便可解决。第二,不把分程序看作“无参过程”,每个分程序享用包围它的那个最近过程的DISPLAY。每个分程序都隶属于某个确定的过程,分程序的层次是相对于它所属的那个过程进行编号的。,:,每个过程被当作是0层分程序。而过程体分程序(假定是一个分程序)当作是它所管辖的第1层分程序。这样,每个过程的活动记录所含的内容有:1.过程的TOP值,它指向过程活动记录的栈顶位置。2.连接数据,共四项:(1)老SP值;(2)返回地址;(3)全局DISPAY地址;(4)调用时的栈顶单元地址,老TOP。,3.参数个数和形式单元 4.DISPAY表。5.过程所辖的各分程序的局部数据单元。对于每个分程序来说,它们包括:(1)分程序的TOP值。当进入分程序时它含现行栈顶地址,以后,用来定义栈的新高度(分程序的TOP值);(2)分程序的局部变量,数组内情向量和临时工作单元。,B,Z,B,1,T,O,D I S P L A Y,D I S P L A Y,形式单元,m,n,2,形式单元,m,n,2,连,接,数,据,连接,数,据,A,的,T O P,A,的,T O P,(c),(d),(c),数组,B,分配之后;,(,d,)进入分程序,B2,2,;,参数传递,(1)procedure exchangel(i,j:integer);(2)var x:integer;(3)begin;(4)x:=ai;ai:=aj;aj:=x(5)end;带有非局部变量和形参的PASCAL过程非局变量ai和aj的值进行交换,i,j为形参(在这里是传值),(1)program reference(input,output);(2)var a,b:integer;(3)procedure swap(var x,y:integer);(4)var temp:integer;(5)begin(6)temp:=x;(7)x:=y;(8)y:=temp(9)end;(10)begin(11)a:=1;b:=2;(12)swap(a,b);(13)writeln(a=,a);writeln(b=,b)(14)end.带有过程swap的PASCAL程序,传地址(变量参数)例如:过程 swap(var x,y:integer);swap(a,b);(a,b为调用时的实参)调用结果a,b的值被改变。传值(值调用)特点是对形式参数的任何运算不影响实参的值。例如:过程 swap(x,y:integer);swap(a,b);其结果:a,b调用前的值不改变。,传值的实现,1.形式参数当作过程的局部变量处理,即在被调过程的活动记录中开辟了形参的存储空间,这些存储位置即是我们所说的形式单元(用以存放实参)。2.调用过程计算实参的值,并将其放在对应形式单元开辟的空间中。3.被调用过程执行时,就像使用局部变量一样使用这些形式单元。,procedure swap(x,y:integer);var temp:integer;begin temp:=x;x:=y;y:=temp end;调用swap(a,b)过程将不会影响a和b的值。其结果等价于执行下列运算:x:=a;y:=b;temp:=x;x:=y;y:=temp,传地址的实现,(call-by-reference)(call-by-address)(call-by-location)把实在参数的地址传递给相应的形参,即 调用过程把一个指向实参的存储地址的指针传递给被调用过程相应的形参:1实在参数是一个名字,或具有左值的表达式-传递左值2实在参数是无左值的表达式-计算值,放入一存储单元,传此存储单元地址3目标代码中,被调用过程对形参的引用变成对传递给被调用过程的指针的间接引用,procedure swap(x,y:integer);var temp:integer;begin temp:=x;x:=y;y:=temp end;调用swap(i,ai)其结果等价于执行下列运算:1把 i和ai的地址分别放到x和y相应的单元a1,a2 2(temp:=x;)temp的内容置为a1所指单元中存的内容 3(x:=y;)a1所指单元的内容置为a2所指单元值4(y:=temp)a2所指单元的内容置为temp的值,(1)swap(x,y)(2)int*x,*y;(3)int temp;(4)temp=*x;*x=*y;*y=temp;(5)(6)main()(7)int a=1,b=2;(8)swap(10)在一个值调用过程中使用指针的C程序在C程序中无传地址所以用指针实现。,过程调用的四元式序列,S call id(),E Epar T1par T2par Tncall id,n,过程调用的四元式序列,(1)S call id()for 队列.q的 每一项P do gen(par,-,-,p);n:=n+1;gen(call,-,-,entry(id)(2)1,E把E.place排在.q 的末端;(3)E,过程作为参数传递,三种环境:词法环境 传递环境 活动环境,program param(input,output);procedure b(function h(n:integer):integer);(*)var m:integer;begin m:=3;writeln(h(2)endb;procedure c;(*)var m:integer;function f(n:integer):integr;(b(f)end c begin c end.,(1)program param(input,output);(2)procedure b(function h(n:integer):integer);(3)begin writeln(h(2)endb;(4)procedure c;(5)var m:integer;(6)function f(n:integer):integr;(7)begin f:=m+n endf;(8)begin m:=0;b(f)end c;(9)begin(10)c(11)end 图10-27 嵌套过程作为参数传递,值结果传递,除了未建立真正的别名之外,这个机制得到的结果与引用传递类似:在过程中复制和使用自变量的值,然后当过程退出时,再将参数的最终值复制回自变量的地址。因此,这个方法有时也被称为复制进,复制出,或复制存储。值结果传递与引用传递的唯一区别在于别名的表现不同。例如,在以下的代码中(C语法):void p(int x,int y)+x;+y;main()int a=1;p(a,a);return 0;在调用p之后,若使用了引用传递,则a的值为3;若使用了值结果传递,则a的值为2。,名字传递,这是传递机制中最复杂的参数了。由于名字传递的思想是直到在被调用的程序真正使用了自变量(作为一个参数)之后才对这个自变量赋值,所以它还称作延尽赋值(delayed evaluation)。因此,自变量的名称或是它在调用点上的结构表示取代了它对应的参数的名字。例如在代码void p(int x)+x;中,若做了一个如p(ai)的调用时,其结果是计算+(ai)。因此,若在p中使用x之前改变i,那么它的结果就与在引用传递或在值结果传递中的不同,int i;int a 10;void p(int x)+i;+x;main()i=1;a1=1;a2=2;p(ai);return 0;对p的调用的结果是将a2设置为3并保持a1不变。,名字传递的解释如下:在调用点上的自变量的文本被看作是它自己右边的函数,生当在被用的过程的代码中到达相应的参数名时,就要计算它。我们总是在调用程序的环境中计算自变,而总是在过程的定义环境中执行过程。,建立内情向量,分配内存的目标代码,(n维可变数组,type-每个元素占一个字)begin k:=1;n:=1;c:=0;while k=n do begin di:=ui-li+1;m:=m*di;c:=c*di+li;把li,ui和di填进内情向量表区;k:=k+1 end;申请m个空间,令首地址为a;把n,c,type,a填进内情 向量表区end,赋值中数组元素的翻译,A V:=EV id|id,E|EV|id,E|id E,结构(记录),抽象数据类型对象,类实例变量的存储结构(CIR)class parent|class parent public int a,b,c;|public a,b,c;public void draw().;|public virtual void draw();|.class child:public parent|public d,e;|public void sift();|void draw();,堆式动态存储分配,堆变量堆空间的管理策略减少碎片的技术空间的释放,C+的堆变量,Int*Ptr;Ptr=new int(5);Int*ptr=new int 10,Delete ptrDelete ptr堆变量是可以在程序运行时根据需要随时创建或删除的变量,C+的堆对象,#includeClass MyclassPublic:Myclass();Myclass(int k,int j);void Set(int,int)m=k;n=j;Myclass();Private:int m,n;,Myclass:Myclass()Set(0,0);CoutDefaultendl;Myclass:Myclass(int k,int j)Set(k,j);Cout“m=“mendl;Myclass:Myclass()Cout“Destructor”endl;,使用new和delete的示例,#includeInt main()Cout“one”endl;Myclass*ptr1=new Myclass;Delete ptr1;Cout“two”endl;Ptr1=new Myclass(5,10);Delete ptr1;Return 0;,oneDefaltDestructortwom=5Destructor,堆式动态存储分配,Const int ArraySize=24;/default sizeClass IntArrayPublic:/operations performed on arrays IntArray(int sz=ArraySize);IntArray(const IntArray,IntArray()函数的实现,引入新的运算符newIntArray:IntArray(int sz)size=sz;/allocate an integer array of size/and set ia to point to itia=new int size;/initialize arrayfor(int i=0;isz;+i)iai=0;,C+语言中new操作符施加在一个类型标识符上(包括类名)Pascal语言中,标准过程new能够动态建立存储空间并相应地置上指针。标准过程dispose是释放空间.new与dispose不断改变着堆存储器的使用情况。C语言中有这些操作的若干个版本,但最基本的是malloc和free,它们都是标准库(stdlib.h)的一部分,堆式动态存储分配,需求:一个程序语言允许用户自由地申请数据空间和退还数据空间,或者不仅有过程而且有进程(process)的程序结构,操作:堆提供两个操作,分配操作和释放操作情况:经一段运行时间之后,这个大空间就必定被分划成许多块块,有些占用,有些无用(空闲)-碎片问题,堆式动态储分配,当运行程序要求一块体积为N的空间时,我们应该分配哪一块给它呢?运行程序要求一块体积为N的空间,但发现没有比N大的空闲块了,然而所有空闲块的总和却要比N大得多 如果运行程序要求一块积为N的空间,但所有空闲块的总和也不够N,那又应怎么办呢?有的管理系统采用一种叫做垃圾回收的办法来对付这种局面。即寻找那些运行程序业己无用但尚未释放的占用块,堆管理,堆空间的管理策略减少碎片的技术空间的释放,堆空间的管理策略,1 定长块管理2 变长块管理,堆式动态储分配的实现,1 定长块管理堆式动态储分配最简单的实现是按定长块进行。初始化时,将堆存储空间分成长度相等的若干块,每块中指定一个链域,按照邻块的顺序把所有块链成一个链表,用指针available指向链表中的第一块。分配时每次都分配指针available所指的块,然后available指向相邻的下一块。归还时,把所归还的块插入链表。考虑插入方便,可以把所归还的块插在available所指的块之前,然后available指向新归还的块。,2 变长块管理除了按定长块进行分配之外,还可以根据需要分配长度不同的存储块,可以随要求而变。按这种方法,初始化时存储空间是一个整块。按照用户的需要,分配时先是从一个整块里分割出满足需要的一小块,以后,归还时,如果新归还的块和现有的空间能合并,则合并成一块;如果不能和任何空闲块合并,则可以把空闲块链成一个链表。再进行分配时,从空闲块链表中找出满足需要的一块,或者整块分配出去,或者从该块上分割一小块分配出去。若空闲块表中有若干个满足需要的空闲块时,该分配哪一块呢?通常有三种不同的分配策略,不同的情况应采用不同的方法。通常在选择时需考虑下列因素:用户的要求;请求分配量的大小分布;分配和释放的频率以及效率对系统的重要等等。,(1)首次满足法:只要在空闲块链表中找到满足需要的一块,就进行分配。(2)最优满足法:将空闲块链表中一个不小于申请块且最接近于申请块的空闲块分配给用户,则系统在分配前首先要对空闲块链表从头至尾描一遍,然后从中找出一块,为避免每次分配都要扫描整个链表,通常将空闲块链表空间的大小从小到大排序。(3)最差满足法:将空闲块表中不小于申请块且是最大的空闲的一部全分配给用户。此时的空闲块链表按空闲的块的大小从大到小排序。只需从链表中删除第一个结点,并将其中一部分分配给用户,而其它部分作为一个新的结点插入到空闲块表的适当置上去。,减少碎片的技术,1分配时,找最小的足够大的块-需保持空闲块的大小排序2 释放时,合并任何相邻的块-搜索全部空闲块表,或其它算法3 将堆变量紧缩在一起,空间的释放,1显式释放2隐式(自动)释放,显式释放,程序设计语言提供机制 如:pascal 的 dispose C 的free程序员必须编写分配和释放存储的明确的调用注意的问题 1 堆变量是不可访问的(垃圾)2 悬挂(不安全)指针,堆式分配和释放的C语言描述,#define NULL 0#define MEMSIZE 8096/*change for different sizes*/typedef fdouble Align;typedef union header struct union header*next;unsigned usedsize;unsigned freesize;s;Align a;Header;/数据类型Header保存每个存储块的簿记信息 static Header mem MEMSIZE;static Header*memptr=NULL;void*malloc(unsigned nbytes)Header*p,*newp;unsigned nunits;nunits=(nbytes+sizeof(Header)-1/sizeof(Header)+1;if(memptr=NULL),memptr-s.next=memptr=mem;memptr-s.usedsize=1;memptr-s.freesize=MEMSIZE-1;for(p=memptr;(p-s.next!=memptr),newp-s.next=p-s.next;p-s.freesize=0;p-s.next=newp;memptr=newp;return(void*)(newp+1);void free(void*ap)Header*bp,*p,*prev;bp=(Header*)ap 1;for(prev=memptr,p=memptr-s.next;(p!=bp),堆的自动管理-隐式存储回收,在一种需要完全动态的运行时环境的语言(OO语言,函数式语言Lisp,ML)中,堆也必须类似地自动管理。自动存储器管理涉及到了前面分配的但不再使用的存储器的回收,可能是在它被分配的很久以后,而没有明确的对free的调用。这个过程称作垃圾回收(grabage collection)。,垃圾回收,垃圾回收程序-寻找可被引用的所有存储器并释所有未引用的存储器。在存储块不再引用时,无论是直接还是通过指针间接的引用,识别这些存储块是一项比维护堆存储 的列表复杂得多的任务。方法-对malloc的调用失败,激活垃圾回收程序垃圾回收算法 mark and sweep,隐式存储回收mark and sweep算法,隐式存储回收要求用户程序和支持运行的回收子程序并行工作,因为回收程序需要知道分配给用户程序的存储块何时不再使用。为了实现并行工作,在存储块中要设置回收子程序访问的信息。存储块格式:,块长度访问计数标记指针用户使用空间,回收过程,分为两个阶段。(1)第一个阶段为标记阶段,对已分配的块跟踪程序中各指针的访问路径。如果某个块被访问过,就给这个块加一个标记。(2)第二个阶段为回收阶段,所有未加标记的存储块回收到一起,并插入空闲块链表中,然后消除在存储块中所加的全部标记。,面向对象的语言中的动态存储器,面向对象的语言在运行时环境中要求特殊的机制以完成其增添的特性:对象、方法、继承以及动态联编。面向对象语言在对运行时方面的要求差异很大。Smalltalk要求与LISP相似的完全动态环境C则保持C的基于栈的环境,实现对象,实现对象的一个简单机制是,初始化代码将所有当前的继承特征(和方法)直接地复制到记录结构中(将方法当作代码指针)。但这样做极浪费空间。另外一种方法是在执行时将类结构的一个完整的描述保存在每个点的存储器中,并由超类指针维护继承性(有时这也称作继承图(inheritance graph)。接着同用于它的实例变量的域一起,每个对象保持一个指向其定义类的指针,通过这个类就可找到所有(局部和继承的)的方法。此时,只记录一次方法指针(在类结构中),而且对于每个对象并不将其复制到存储器中。由于是通过类继承的搜索来找到这个机制的,所以该机制还实现继承性与动态联编。其缺 在于:虽然实例变量具有可预测的偏移量(正如在标准环境中的局部变量一样),方法却没有,而且它们必须由带有查询功能的符号表结构中的名字维护。这是对于诸如Smalltalk的高度动态语言的合理的结构,因为类结构可以在执行中改变。,C+中选择的方法,将整个类结构保存在环境中,计算出每个类的可用方法的代码指针列表,并将其作为一个虚拟函数表(virtual function table)而存放在(静态)存储器。它的优点在于:可做出安排以使每个方法都有一个可预测的偏移量,而且也不再需要用一系列表查询遍历类的层次结构。现在每个对象都包括了一个指向相应的虚拟函数表而不是类结构的指针(当然,这个指针的位置必须也有可预测的偏移量)。,例C+类声明:class Apublic:double x,y;void f();virtual void g();class B:public Apublic:double z;void f();virtual void h();,类A的一个对象应出现在存储器中(带有它的虚拟函数表)而类B的一个对象则应如下所示:,