《汇编语言源程序格式.ppt》由会员分享,可在线阅读,更多相关《汇编语言源程序格式.ppt(97页珍藏版)》请在三一办公上搜索。
1、第2章 汇编语言程序格式,2.1 汇编语言语句格式2.2 伪指令2.3 汇编语言源程序基本框架,2.1 汇编语言语句格式,同其他程序设计语言一样,汇编语言的翻译器(汇编程序)对源程序有严格的格式要求。这样,汇编程序才能确切翻译源程序,形成功能等价的机器指令(目标代码),连接后能直接运行。汇编语言程序格式就是汇编语言必须遵循的语法规则。,2.1.1 汇编语言语句类型,汇编语言源程序由语句序列构成,汇编语言程序中的语句可以分为指令语句、伪指令语句和宏指令语句三种。(1)指令语句:对应于CPU指令系统中的一条机器指令,由CPU执行,能完成一定操作功能,能够翻译成机器代码的语句。(2)伪指令语句:无对
2、应的机器指令,不由CPU执行,只为汇编程序在翻译汇编语言源程序时提供有关信息,并不翻译成机器代码的语句。(3)宏指令语句:就是由若干条指令语句形成的语句,一条宏指令语句的功能相当于若干条指令语句的功能,详见第5章。,2.1.2 汇编语言语句格式,汇编语言源程序中的每个语句可以由4项组成,格式如下:名字:操作码 操作数,操作数;注释其中,名字项是一个符号项。操作码项是一个操作码的助记符,它可以是指令、伪指令或宏指令名。操作数项由一个或多个表达式组成,它提供为执行所要求的操作而需要的信息。注释项用来说明程序或语句的功能。“;”为识别注释项的开始。带方括号的项是可选项,需要根据具体情况而定。汇编语言
3、源程序中的每条语句一般占一行,各项之间必须用空格或制表符作为分隔符,操作数之间用逗号分隔。,1名字项名字是用户按照一定规则定义的标识符,可由下列符号组成:字母 AZ、az数字 09 特殊字符?、.、_、$数字不能作名字项的第一个字符。而圆点仅能用作第一个字符,可以用很多字符来说明名字,但只有前面的31个字符能被汇编程序所识别。为了便于记忆,名字的定义应该能够见名知义,如用BUFFER表示缓冲区、SUM表示累加和等。名字有两种形式:标号或变量。指令语句中的名字通常用标号表示,而伪指令语句中的名字通常用变量名、段名和过程名表示,多数情况下用变量名表示。,(1)标号标号在代码段中定义,也可以用EQU
4、或LABEL伪指令来定义,标号与其所代表的指令之间用冒号分开,用来代表一条指令所在单元的地址。标号也可以作为过程名定义。标号经常在转移指令的操作数字段出现,用以表示转向的目标地址。标号在命名时,应尽量取有意义的字符,以便程序的阅读和理解。,标号有3种属性:段属性、偏移属性和类型属性。段属性:标号所代表指令单元的段起始地址,此值必须在一个段寄存器中,而标号的段则总是在CS寄存器中。偏移属性:标号所代表指令单元的段内偏移地址,标号的偏移地址是从段起始地址到定义标号的位置之间的字节数。对于16位段是16位无符号数。类型属性:用来指出标号是在本段内引用还是在其他段中引用的。如是在段内引用的,则称为NE
5、AR,转移源和转移目标在同一个代码段中,转移时,只改变IP值,不改变CS值;如在段外引用,则称为FAR,转移源和转移目标在不同的代码段中,转移时,既改变IP值,又改变CS值。,(2)变量 变量在除代码段以外的其它段中定义,后面不跟冒号。它也可以用EQU或LABEL伪指令来定义。变量是一个可以存放数据的存储单元的名字,即存放数据的存储单元的地址符号名。变量用DB、DW、DD定义,此时变量名仅表示该数据区或存储区的第一个数据单元的首地址。变量经常在操作数字段出现。,变量也有3种属性:段属性、偏移属性和类型属性。段属性:变量所代表数据单元的段起始地址,此值必须在一个段寄存器中(DS、ES或SS中)。
6、偏移属性:变量所代表数据单元的段内偏移地址,变量的偏移地址是从段的起始地址到定义变量的位置之间的字节数。对于16位段是16位无符号数。在当前段内给出变量的偏移值等于当前地址计数器的值,当前地址计数器的值可以用$来表示。类型属性:变量的类型属性定义该变量所保留的字节数,如BYTE(1个字节长),WORD(2个字节长),DWORD(4个字节长)。这一点,将在数据定义伪指令中说明。在同一个程序中,同样的标号或变量的定义只允许出现一次,否则汇编程序会指示出错。,2操作码项,操作码项可以是指令、伪指令或宏指令的助记符。助记符表示指令语句的功能,如INC、MOV等,其符号与意义是由系统定义的,编程时必须照
7、写不误,既不能多写,也不能少写,如果指令带有前缀(如REP、REPE等),则指令前缀和指令助记符要用空格分开。对于指令,汇编程序将其翻译为机器语言指令。对于伪指令,汇编程序将根据其所要求的功能进行处理。对于宏指令,则将根据其定义展开。在第5章中将会专门讨论。,3操作数项,指令中的操作数用来指定参与操作的数据。对于一般指令,可以有一个或两个操作数,也可以没有操作数;对于伪指令和宏指令,可以根据需要有多个操作数。操作数多于一个时,各操作数之间用逗号分开。,操作数可以是常数、寄存器、标号、变量或由表达式组成。在这里,将专门对表达式加以说明。表达式是常数、标号、变量、寄存器与一些操作符相组合的序列,可
8、以有数字表达式和地址表达式两种。数字表达式由汇编程序根据优先级规则计算得到一个常数值。地址表达式由汇编程序计算得到一个地址或一个常数值(地址间的距离长度)。组成表达式的操作符有算术、逻辑、关系、数值返回、属性操作符。,常用的操作符,算术操作符逻辑与移位运算符关系运算符 数值返回运算符 属性运算符,算术操作符算术运算符包括:+、*、/、MOD(取余)。运算符MOD是作除法操作,取余数,如10 MOD 3=1。算术运算符可以用于数字表达式或地址表达式中。但当它用于地址表达式时,只有当其结果有明确的物理意义时才是有效的结果,例如,两个地址相乘或相除是无意义的。在地址表达式中,可以用+或-,但也必须注
9、意其物理意义,例如把两个不同段的地址相加也是无意义的。经常使用的方法是“地址常量”来描述指针的移动,例如,SUM+1是指SUM字节单元的下一个字节单元的地址(注意:不是指SUM单元的内容加1),而SUM-1则是指SUM字节单元的前一个字节单元的地址。,【例2.1】将首地址为ARRAY的字数组的第6个字传送到DX寄存器中。MOV DX,ARRAY+(6-1)*2【例2.2】数组ARR定义如下,试写出把数组长度(字数)存入CX寄存器的指令。ARR DW 1,2,3,4,5,6,7ARREND DW?其中,ARREND是为计算数组长度而建立的符号地址,则指令如下:MOV CX,(ARREND-ARR
10、)/2汇编程序在汇编期间将计算出表达式的值而形成指令:MOV CX,7,(2)逻辑与移位运算符逻辑运算符逻辑运算符包括:AND(逻辑与)、OR(逻辑或)、XOR(逻辑异或)、NOT(逻辑非)。逻辑运算符是按位操作的,它的操作数只能是数字,且结果也为数字。逻辑运算符只能用在数字表达式中,不能用在地址表达式中。逻辑运算符和逻辑运算指令是有区别的,逻辑运算符的功能在汇编阶段完成,逻辑运算指令的功能是在程序执行阶段完成。要注意AND、OR、XOR、NOT不是助记符,而是运算符。,【例2.3】AND AL,78H AND 0FH等价于:AND AL,08H【例2.4】设VALUE是字节型变量,分析下面这
11、条语句执行完AL寄存器的内容。MOV AL,VALUE AND 01H在汇编后,该语句的源操作数(VALUE AND 01H)可能产生两个结果之一:当VALUE值的D0位为1时,VALUE和01与操作的结果为01H,则该语句变成MOV AL,01H;当VALUE值的D0位为0时,VALUE和01与操作的结果为00H,则该语句变成MOV AL,00H。因此,执行后AL寄存器的内容为01H或00H。,移位运算符移位运算符有:SHL(逻辑左移)、SHR(逻辑右移)格式:表达式 SHL(或SHR)n(移位次数)汇编程序将表达式左移或右移n位,高位或低位补0,若移位次数大于15,则结果为0。【例2.5】
12、VAL EQU 5H;符号常量VAL值=5H MOV AL,VAL SHR 1;VAL=00000101B逻辑 右移1位为00000010=2注意:移位运算符SHL/SHR在操作数中,汇编时对常量进行移位;而移位指令SHL/SHR是在指令的操作码位置,执行时对寄存器或存储器单元中的操作数移位。,(3)关系运算符关系运算符包括:EQ(等于)、NE(不等)、LT(小于)、GT(大于)、LE(小于等于)、GE(大于等于)6种。格式:表达式1 关系运算符 表达式2计算结果,若关系成立,则为全1,即0FFFFH;关系不成立,则为全0。,【例2.6】MOV BX,32 EQ 45 等价于:MOV BX,0
13、【例2.7】MOV BX,56 GT 30 等价于:MOV BX,0FFFFH【例2.8】MOV BX,(VAL LT 5)AND 20)OR(VAL GE 5)AND 30)当VAL5时,汇编结果应该是:MOV BX,20 当VAL5时,汇编结果应该是:MOV BX,30,(4)数值返回运算符数值返回运算符包括:SEG(取段地址)、OFFSET(取偏移地址)、TYPE(取类型值)、LENGTH(取长度)、SIZE(取总字节数)这些操作符把一些特征或存储器地址的一部分作为数值回送,但不改变源操作数的属性。,SEG格式:SEG 变量名/标号汇编程序将回送变量或标号的段地址值。【例2.9】如果DA
14、TA_SEG是从存储器的05000H开始的一个数据段的段名,OPER1是该段中的一个变量名,则MOV BX,SEG OPER1将把05000H作为立即数插入指令。实际上,由于段地址是由连接程序分配的,所以该立即数是连接时插入的。执行期间则使BX寄存器的内容变成为05000H,OFFSET格式:OFFSET 变量名/标号 汇编程序将回送变量或标号的偏移地址。【例2.10】MOV BX,OFFSET OPER_2汇编程序将OPER_2的偏移地址作为立即数回送给指令,而在执行时则将该偏移地址装入BX寄存器中,所以这条指令与LEA BX,OPER_2是等价的。,TYPE格式:TYPE 变量名/标号 如
15、果该表达式是变量,则汇编程序将回送变量的以字节数表示的类型:DB为1,DW为2,DD为4。如果该表达式是标号,则汇编程序将回送代表该标号类型数值:NEAR为-1,FAR为-2。如果表达式为常数,则应回送0。【例2.11】ARRAY DW 1,2,3则对于指令:ADD SI,TYPE ARRAY汇编程序将其形成为:ADD SI,2,LENGTH格式:LENGTH 变量名对于变量中使用DUP的情况,汇编程序将回送分配给该变量的单元数,对于其他情况则送1。【例2.12】FEES DW 100 DUP(0)对于指令:MOV CX,LENGTH FEES汇编程序将其形成为:MOV CX,100,SIZE
16、格式:SIZE 变量名汇编程序应回送分配给该变量的总字节数,也就是LENGTH和TYPE的乘积,即:SIZE=LENGTHTYPE【例2.13】FEES DW 100 DUP(0)对于指令:MOV CX,SIZE FEES汇编程序将其形成为:MOV CX,200,(5)属性运算符属性运算符包括:PTR(属性修改运算符)、“:”(段跨越前缀符)和SHORT(短取代运算符)。PTR格式:类型 PTR 表达式是属性修改运算符,用PTR来建立符号地址,但它本身并不分配存储器,只是用来给已分配的存储地址赋予另一种属性,使该地址具有另一种类型,仅在本语句有效。格式中的类型字段表示所赋予的新的类型属性,而表
17、达式字段则是被取代类型的符号地址。,【例2.16】已有数据定义如下:ARRAY DW?可以用以下语句对这两个字节赋予另一种类型定义:ARRAY1 EQU BYTE PTR ARRAYARRAY2 EQU BYTE PTR(ARRAY+1)这里,ARRAY和ARRAY1两个符号地址具有相同的段地址和偏移地址,但是它们的属性类型不同,前者为1,后者为2。,此外,有时指令中也要求使用PTR运算符。例如,当汇编程序遇到“MOV BX,5”指令时,指令要求把立即数5存入BX寄存器内容所指定的存储单元中,但是,汇编程序不能分清是存入字单元还是字节单元,此时必须用PTR运算符来说明属性,应该写明:MOV B
18、YTE PTR BX,5或MOV WORD PTR BX,5,:格式:段寄存器:地址表达式“:”称为段运算符,又称为段跨越前缀符。用于临时给变量、标号或地址表达式指定一个段属性,地址表达式的EA和类型属性不变。在指令中代替默认的段以形成物理地址。【例2.17】MOV AX,ES:BX+SI;PA=ES*16+EA,临时替换默认的DS,SHORT短取代运算符,用来修饰JMP指令中转向地址的属性,指出转向地址是在下一条指令地址的-128+127个字节范围内。【例2.18】JMP SHORT NEXTNEXT:MOV AX,BX,(6)运算符的优先级以上说明了5类常用的运算符,在计算表达式时,应该首
19、先计算优先级高的运算符,同级运算符从自左向右进行计算。下面给出运算符的优先级别,从高到低排列如下:()、LENGTH、SIZE,然后是段跨越前缀符“:”PTR、OFFSET、SEG、TYPE、THIS以及段运算符HIGH、LOW*、/、MOD、SHL、SHR+、-EQ、NE、LT、LE、GT、GENOTANDOR、XORSHORT,4注释项注释项由分号“;”开始,用来说明一条指令或一段程序的功能,它不属于程序本身,在汇编过程中,汇编程序不会对注释作任何加工,这部分不产生机器代码,注释只是为了增加程序的可读性,便于阅读、理解和修改程序。对于汇编语言程序来说,注释项的作用是很明显的,读者应该在编写
20、汇编程序的过程中,注意学会写好注释。,2.2 伪指令,2.2.1 处理器选择伪指令2.2.2 数据定义伪指令2.2.3 模块命名和标题伪指令2.2.4 程序结束伪指令(END)2.2.5 完整段定义伪指令(SEGMENT、ENDS、ASSUME)2.2.6 简化段定义伪指令2.2.7 表达式赋值伪指令2.2.8 定位伪指令(ORG)2.2.9 标号定义伪指令(LABEL),2.2.1 处理器选择伪指令,由于80 x86的所有处理器都支持8086/8088指令系统,但每一种高档的机型又都增加一些新的指令,因此,在编写程序时要对所用处理器有一个明确的选择。此类伪指令格式为:8086;选择8086指
21、令系统 286;选择80286指令系统 286P;选择保护模式下80286指令系统 386;选择80386指令系统需要注意的问题:(1)处理器选择伪指令在完整和简化两种程序框架中均可使 用。(2)缺省时为选择8088/8086微处理器指令系统。,2.2.2 数据定义伪指令,程序中所涉及到的大量初始数据、中间数据和结果数据,一般都要在程序设计时进行预置和分配存储空间,可以通过数据定义伪指令实现,其格式为:变量名 DB 表达式;定义字节型变量,每个操 作数占1个字节的内存单元变量名 DW 表达式;定义字型变量,每个操作 数占2个字节的内存单元变量名 DD 表达式;定义双字型变量,每个操 作数占4个
22、字节的内存单元,其中,DB、DW、DD称为伪指令助记符,分别用来定义字节型、字型、双字型变量。数据定义伪指令可用于除代码段以外的任何段中,但主要用于数据段和附加数据段中,用来按名字存取其对应的内存单元。数据定义伪指令可以为一个或连续的存储单元设置数值初值。其中变量名、助记符和操作数之间以空格隔开,且方括号中内容为可选项。表达式可为如下几种情况:常数表达式、问号(?)、地址表达式(适用DW和DD)、字符及字符串(适用于DB)、重复子句DUP(表达式)、用逗号分开的上述各项。,需要说明的是:(1)若是字符串且是DB类型时,必须以单引号括起来,括起来的字符个数不能超过255个,字符串以ASCII码的
23、形式按地址递增的顺序依次存放在以变量名开始的内存单元中;(2)若是?时,表示为变量预留内存单元。例如:X1 DB?;为变量X1预留1个字节单元;(3)若是带DUP的表达式表示定义多个相同的操作数和要预留多个内存单元。DUP的使用格式如下:表达式 DUP(操作数项)表达式为要重复的次数;操作数表示要重复的内容,可以是常数或表达式、字符串、?和带DUP的表达式。,【例2.19】操作数可以是常数,或者是表达式。DATA1 DB 12,4,10H;每个操作数占用一个字节单元DATA2 DW 100,100H,-5;每个操作数占用一个字单元DATA3 DD 3*20,0FFFDH;每个操作数占用一个双字
24、单元汇编程序可以在汇编期间在存储器中存入数据,如图2.1所示。,图2.1 例2.19的汇编结果,【例2.20】操作数也可以是字符串。下面3个定义语句是等价的。存储器存储情况如图2.2所示。STR1 DB ABCD;存放地址由低到高分别为:41H、42H、43H、44HSTR1 DB A,B,C,DSTR1 DB 41H,42H,43H,44H,图2.2 例2.20的汇编结果,2.2.3 模块命名和标题伪指令,1模块命名伪指令(NAME)格式:NAME 模块名该命令表示一个模块的开始,并给出该模块名。如果程序中没有使用NAME伪指令,也可以使用TITLE伪指令来给源程序设置标题,以后每页的第一行
25、都列出该标题。2标题伪指令(TITLE)格式:TITLE TEXT这里TEXT为标题,即为不加引号的字符串,最长为60个字符。一个程序模块中只允许一个TITLE命令,否则会引起误会。在无NAME命令情况下,TEXT的前6个字符一般用作模块名。,2.2.4 程序结束伪指令(END),格式:END 标号其中:标号可以是过程名或带“:”的标号,标号表示为程序开始执行的起始地址,即主程序中的第一条可执行指令的地址。当标号缺省时表示该程序是一个子程序,不能单独运行,只能被其他程序调用。模块的一般形式为:NAME 模块名所有的语句END 启动标号或过程,2.2.5 完整段定义伪指令(SEGMENT、END
26、S、ASSUME),8086按照逻辑段组织程序,具有代码段、数据段、附加段和堆栈段。因此,一个汇编语言源程序可以包括若干个代码段、数据段或堆栈段,段与段之间的顺序可以随意排列。逻辑段用汇编语言源程序中的段定义伪指令来定义。,1完整段定义伪指令(SEGMENT、ENDS)采用完整段定义伪指令可具体控制汇编程序和连接程序在内存中组织代码和数据的方式。为此,需要用段定义伪操作,其格式如下:段名 SEGMENT 定位类型 组合类型 类别名段名 ENDS,定义了一个以SEGMENT伪指令开始,以ENDS伪指令结束的存储段,二者总是成对出现,缺一不可。中间省略的部分称为段体。对数据段、附加段、堆栈段来说,
27、一般为变量、符号定义等伪指令;对代码段来说,则主要是程序代码。方括号中的为可选项,当有可选项时各项顺序不能错,可选项之间用空格隔开。下面分别介绍这些部分的作用。(1)段名段名是用户自定义的,但不要与指令助记符或伪指令重名,用来指示汇编程序为该段分配的存储区的首地址,它有段地址和偏移地址两个属性。段开始和段结束的段名必须相同。,(2)定位类型说明段的起始地址的边界要求,指示连接程序按定位类型提出的要求,安排各段在内存的相互衔接方式。它有5种可选择类型:BYTE:段的起始地址可以从任何地址开始。段起始地址(20位):B WORD:段的起始地址必须以偶地址开始,即该地 址的D0位应为0。段起始地址(
28、20位):0 B,DWORD:段的起始地址必须为4的倍数,即该地址的D1和D0位应为0。段起始地址(20位):00 B PARA:段的起始地址必须从小段边界开始,即该地址的D3D0位应为0。段起始地址(20位):0000 BPAGE:段的起始地址必须从页的边界开始,即该地址的D7D0位应为0。段起始地址(20位):0000 0000 B如未指定定位类型,则汇编程序默认为PARA。,(3)组合类型当程序有多个段时,组合类型用来说明段与段之间是怎样连接和定位的,共有6种组合类型:不指定或称隐含方式:表示本段与其他模块中的同 名段无连接关系,它将作为一个独立的段运行。PUBLIC:本段与其他模块中说
29、明为PUBLIC方式的 同名段顺序连接,组成一个大的逻辑段,它们共用 同一个段起始地址。COMMON:本段与其他模块中说明为COMMON方 式的同名段从同一地址开始重叠连接,段长是同名 段中最长的段的长度。,STACK:表示该段是堆栈段的一部分。把所有相同 类别名的具有STACK组合类型的段连接成一个连 续段,该段长度为各原有段的总和。将连续段首地 址送SS,段内最大偏移地址送SP(SP指向栈顶)。当定义了STACK属性后,在主程序中可省略对SS和 SP的初始化。MEMORY:与PUBLIC同义。AT表达式:表示本段的段地址由表达式的值得到。该段的偏移地址为“零”。这种方式用户可直接规定该 段
30、的起始地址。例如,AT 1000H,定位的段首地址 为(1000H:0000H),但这种方式不能用于代码段。,(4)类别名类别名必须用单引号括起来。连接时对不同模块、不同名的程序段只要类别名相同,则放在一个连续的物理空间,但每段之间是独立的,不进行组合。,2指定段寄存器伪指令(ASSUME)在程序中,必须明确段和段寄存器之间的关系,这可用ASSUME伪指令来实现,其格式为:ASSUME 段寄存器名:段名,段寄存器名:段名ASSUME伪指令告诉汇编程序,在运行期间通过哪个段寄存器才能找到所要的指令和数据。该指令放在程序的代码段中。如:ASSUME CS:CODE,ES:EXTRA,DS:DATA
31、,SS:STACK,3段寄存器的装入 ASSUME伪指令只是指出各段和段寄存器之间的关系,但并未真正将段基地址装入相应的段寄存器中,所以在程序的代码段开始处就应该先进行数据段DS、附加段ES和堆栈段SS的段基址的装入,否则无法正确对数据进行寻址操作。而代码段CS则在加载程序后由系统自动装入。DS和ES的装填方法可以使用相同的方法,直接由用户程序进行加载。,(1)DS、ES的装入 MOV AX,DATA;数据段段基地址送AX寄存器 MOV DS,AX;AX寄存器的内容送数据段寄存器DS或 MOV AX,SEG X;变量X所在数据段的段基址送AX寄存器 MOV DS,AX,(2)CS的装入对CS和
32、IP的装入方法是利用END后的标号来完成的。因为该标号是可执行程序的起始地址。如:START:END START系统自动将START所在段的段地址送CS寄存器,将START所在段内的偏移地址送IP寄存器。,(3)SS的装入方法1:堆栈段SS也可以不用用户装入,而由系统自动装填。但是在定义堆栈段时,必须把参数写全。这时,将程序装入内存,系统会自动地把堆栈段地址和堆栈指针置入SS和SP中,因而可以不在代码段中装入SS和SP的值。STACK1 SEGMENT PARA STACK STACKDB 50H DUP(?)STACK1 ENDSCODE SEGMENTASSUME CS:CODE,SS:S
33、TACK1CODE ENDS当目标代码装入存储器后,SS中已自动装入STACK段的段基值,堆栈指针SP指向堆栈的底部+1的存储单元。,方法2:STACK1 SEGMENT PARADW 50H DUP(?)TOP LABEL WORD;TOP属性为WORDSTACK1 ENDSCODE SEGMENTASSUME CS:CODE,SS:STACK1START:MOV AX,STACK1MOV SS,AX;堆栈段的段地址送SSMOV SP,OFFSET TOP;堆栈段的栈顶地址送SPTOP是该堆栈的初始栈顶部地址。,4操作系统下汇编程序的正常结束对于可执行文件(.EXE)在DOS提示符下正常结束
34、可以用两种方法:方法1:MOV AX,4C00H;INT 21H方法2:MAIN PROC FARPUSH DS;保存原来的数据段段地址MOV AX,0H;0送AX PUSH AX;0压栈RET;返回DOSMAIN ENDP,2.2.6 简化段定义伪指令,简化的段定义书写简单,有利于实现汇编语言程序模块与高级语言程序模块的连接,它可以由操作系统自动安排段序,自动保证名字定义的一致性。,1存储模式选择伪操作(MODEL)格式:MODEL 模式类型 本语句一般放在段定义之前,用来指明简化段所用的内存模式,即用来说明在存储器中是如何安放各个段的。模式类型说明代码段在程序中如何安排,代码的寻址是近还是
35、远;数据段在程序中又是如何安排的,数据的寻址是近还是远。根据它们的不同组合,模式类型可以有如下5种。,Tiny模式:也叫微模式,所有数据及代码放 入同一 个物理段 内,该模式用于编写较小的 源程序,这 种模式的源程序最终可以形成COM文件。Small:也叫小模式,所有数据放入一个 64KB的段 中,所有代码放入另一个64KB的段中,即程序中只 有一个数据段和一个代码段这是一般应用程序最常 用的一种模式。,Medium:也叫中模式:所有数据放入一个 64KB的 段中,代码可以放入多于一个的段中,即程序中可 以有多个代码段。Compact:也叫压缩模式,所有代码放入另 一个 64KB的段中,数据可
36、以放入多于一个的段中,即程 序中可以有多个数据段。Large:也叫大模式,代码和数据都可以分别放入 多于一个的段中,即程序中可以有多个代码段和多 个数据段。,2数据段定义伪指令(DATA)格式:DATA 名字 定义一个数据段,如果有多个数据段,则用名字来区别:只有一个数据段时,隐含段名为DATA。3堆栈段定义伪指令(STACK)格式:STACK 长度 定义一个堆栈段,并形成SS及SP的初值,SP的默认值为1024,隐含段名为STACK。可选的长度参数指定堆栈段所占存储区的字节数,默认大小是1KB。,4代码段定义伪指令(CODE)格式:CODE 名字 定义一个代码段,如果有多个代码段,则用名字来
37、区别:只有一个代码段时,隐含段名为CODE。5程序开始伪指令(STARTUP)格式:STARTUP,该伪指令按照给定的CPU类型,根据 MODEL语句选择的存储模式,产生程序开始执行的代码,同时还指定了程序开始执行的起点。在小模式下,STARTUP伪指令主要设置了数据段DS的值,同时按照存储模式要求使堆栈段SS=DS。使用了STARTUP伪指令,可以省略将数据段寄存器装入DS的语句。,6程序返回伪指令(EXIT)格式:EXIT EXIT产生终止程序执行返回操作系统的指令代码。它的可选参数是一个返回的数码,通常用0代表没有错误,例如,EXIT 0对应的代码是:MOV AX,4C00HINT 21
38、H STARTUP和EXIT的引入,大大简化了汇编语言程序的复杂度。,7与简化段定义有关的预定义符号 汇编程序中给出了与简化段定义有关的一组预定义符号,它们可在程序中出现,并由汇编程序识别使用。如在完整段定义情况下,需要用段名装入数据段寄存器,MOV AX,DATAMOV DS,AX,若采用简化段定义,则数据段只用DATA来定义,而并未给出段名,此时可用MOV AX,DATAMOV DS,AX这里,预定以符号DATA就给出了数据段定的段名。需要说明的是,当使用简化段定义伪指令时,必须在这些简化段伪指令出现之前,即程序的一开始先用 MODEL定义存储模型,然后再用简化段定义伪指令定义段。每一个新
39、段的开始就是上一段的结束,而不必用ENDS作为段的结束符。,2.2.7 表达式赋值伪指令,有时程序中多次出现同一个表达式,为方便起见,可以将该表达式赋予一个名字,以后凡是用到该表达式的地方,就用这个名字来代替。在需要修改该表达式的值时,只需在赋予名字的地方修改即可。可见,表达式赋值伪指令的引入提高了程序的可读性,也使其更加易于修改。,1等值伪指令EQU格式:符号名 EQU 表达式 用符号名来代替表达式的值。在程序中凡是需要用到该表达式的地方均可用符号名来替换。在同一源程序中,EQU伪操作中的表达式是不允许重复定义的。上式中的表达式可以是任何有效的操作数格式,可以是任何可以求出常数值的表达式,也
40、可以是任何有效的助记符。举例如下。,【例2.26】D1 EQU 80;常数D2 EQU X+2;表达式D3 EQU SI+2;存储单元D4 EQU ES:SI+2;存储单元D5 EQU CX;寄存器D6 EQU ADD;指令助记符,2等号伪指令“=”格式:符号名=表达式“=”的功能与EQU伪指令的功能类似,不同的是:在同一个程序中,“=”可以对一个符号重复定义。【例2.27】Y1=7Y1=128的定义是正确的。而Y1 EQU 7Y1 EQU 128的定义是错误的。,3解除定义伪指令PURGE格式:PURGE 符号1,符号2,符号n解除指定符号的定义,解除符号定义后,可以用EQU重新定义。【例2
41、.28】Y1 EQU 7PURGE Y1Y1 EQU 128上面的定义是正确的。,2.2.8 定位伪指令(ORG),1地址计数器在介绍该语句之前,先介绍地址计数器。在汇编程序对源程序汇编过程中,使用地址计算器保存当前正在汇编的指令的偏移地址。每遇到一个新的段,把地址计数器初始化为零,每处理一条指令,地址计数器就增加一个值,此值为该指令所需要的字节数。地址计数器的值可用符号表示,汇编语言允许用户直接用来应用地址计数器的值,因此指令JNE+5的转向地址是JNE指令的首地址加上5。,当用在指令中时,它表示本条指令的第一个字节的地址。在这里,+5必须是另一条指令的首地址。否则,汇编程序将指示出错信息。
42、当用在伪操作的参数字段时,则和它用在指令中的情况不同,它所表示的是地址计数器的当前值。【例2.29】ARRAY DW,1,2,+4,3,4如汇编时ARRAY分配的偏移地址为0074,则汇编后的存储区将如图2.8所示。数组中两个+4得到的结果是不同的,这是由于的值是在不断变化的缘故。,图2.8 例2.29的汇编结果,2、ORG伪指令汇编地址计数器的值可以用定位伪指令ORG来设置。格式:ORG 常数表达式该指令告知汇编程序,使其后的指令或数据从表达式的值所指定的偏移地址开始存放。如常数表达式的值为n,则ORG伪指令可以使下一个字节的地址成为常数表达式的值n。常数表达式的值应为正整数065535之间
43、的值。,【例2.30】有一个数据段的内容如下,请分析各变量的偏移地址或内容。DATA SEGMENT;数据段定义开始伪指令ORG 100H;以下所定义的第一个变量 的偏移地址从100H开始X DB 12H;X的偏移地址为0100HY DW?;Y的偏移地址为0101HORG 200H;以下所定义的第一个变量 的偏移地址从200H开始Z DD 9C56H;Z的偏移地址为0200HDATA ENDS;数据段定义结束伪指令,2.2.9 标号定义伪指令(LABEL),格式:符号名 LABEL 类型 为紧跟在LABEL伪指令后的变量、标号建立新的符号名,并刷新其类型属性。对于标号,其类型为NEAR,FAR
44、;对变量,其类型为BYTE、WORD、DWORD。LABEL伪指令提供了另一种定义标号或变量名的方法,但它并不为符号名分配存储空间。,【例2.31】LABEL与变量的连用 BARRAY LABEL BYTE ARRAY DW 100 DUP(0)ADD AL,BARRAY99;取第100个字节元素 做加法 ADD AX,ARRAY98;取第50个字做加法上例中定义了两种类型的变量。BARRAY为字节型,ARRAY为字型。它们的段值和偏移地址完全相同,都指向保留的100个字单元的首地址。目的是完成程序中字节和字的两种类型的操作。,【例2.32】LABEL与标号的连用 SUBRTE LABEL F
45、AR SUBRT:SUB AX,AX JMP SUBRT;段内转移 FARPRO PROC FAR JMP SUBTRE;段间转移 两个标号SUBRTE和SUBRT均指向同一指令,但由于它们的类型不同(SUBRTE是FAR,而SUBRT后有冒号,其类型隐含为NEAR),所以可用不同的调用方法(近或远)来访问标号所指的程序段。其他代码段可通过远标号SUBRTE来访问该程序段,当前代码段可通过近标号SUBRT来访问该程序段。,2.3.1 完整段定义框架,2.3 汇编语言源程序基本框架,框架1:STACK SEGMENT;定义堆栈段STACK ENDSDATA SEGMENT;定义数据段DATA E
46、NDSEXTRA SEGMENT;定义附加段EXTRA ENDS,CODE SEGMENT;定义代码段MAIN PROC FARASSUME CS:CODE,DS:DATA,SS:STACK,ES:EXTRASTART:PUSH DS;保存原数据段SUB AX,AXPUSH AX;AX置0,入栈保存 MOV AX,DATAMOV DS,AX,MOV AX,STACKMOV SS,AX MOV AX,EXTRA MOV ES,AX;程序RET;子程序结束返回 DOSMAIN ENDPCODE ENDS;代码段结束END START,框架2:STACK SEGMENT;定义堆栈段STACK END
47、SDATA SEGMENT;定义数据段DATA ENDSEXTRA SEGMENT;定义附加段EXTRA ENDS,CODE SEGMENT;定义代码段ASSUME CS:CODE,DS:DATA,SS:STACK,ES:EXTRASTART:MOV AX,DATAMOV DS,AX;DS寄存器装入MOV AX,STACKMOV SS,AX;SS寄存器装入MOV AX,EXTRA,MOV ES,AX;ES寄存器装入;程序MOV AX,4C00HINT 21H;子程序结束返回 DOSCODE ENDS;代码段结束END START;汇编结束,程序 起点为START,2.3.2 简化段定义框架,框
48、架1:MODEL SMALLSTACK;堆栈段DATA;数据段CODE;代码段,START:MOV AX,DATA;将数据段地址装 入DS寄存器MOV DS,AX;程序MOV AX,4COOHINT 21H;返回DOSEND START,框架2:MODEL SMALLSTACK;堆栈段DATA;数据段CODE;代码段,STARTUP;程序起始点,并 建立DS、SS内容;程序EXIT;程序结束,返回 DOSEND;汇编结束,习 题,2.1请解释变量和标号的含义,两者有何区别?2.2变量和标号有什么属性?2.3伪指令语句与指令语句的本质区别是什么?伪指令有什么主要用途?2.4数值返回运算符有哪几种
49、?简述LENGTH和SIZE的区别。,2.5画图说明下列伪指令所定义的数据在内存中的存放形式。(1)ARR1 DB 6,34H,-7(2)ARR2 DW 3C5DH,1,?(3)ARR3 DB 2 DUP(1,2 DUP(2,5),3)(4)ARR4 DB HELLO(5)ARR5 DB 1234,2.6写出下列变量定义语句。(1)为缓冲区BUF1预留20B的存储空间。(2)为字符串ABCD,1234存放于BUF2存储区中2.7有符号定义语句如下:BUF DB 2,3,4,5,345EBUF DB 8LT EQU EBUF-BUF问LT的值是多少?,2.8假设程序中的数据定义如下:A DW?B DB 16 DUP(?)C DD?T EQU-A问T的值是多少?它表示什么意义?2.9如何规定一个程序执行的开始位置?主程序执行结束应该如何返回DOS?源程序在何处停止汇编过程?2.10EQU伪指令与“=”伪指令有何区别?,2.11指出下列伪指令表达方式的错误,并改正之。(1)DATA SEG(2)SEGMENT CODE(3)MYDATA SEGMENT/DATAENDS(4)MAIN PROC FAREND MAINMAIN ENDP,
链接地址:https://www.31ppt.com/p-6186522.html