汇编语言程序设计02数据表示与汇编语言基础.ppt
汇编语言程序设计,_02_数据表示与汇编语言基础大连理工大学软件学院_朱明2009年5月31日_ V1.1,第一章提问,IA-32内部有8个32位寄存器,如EAX、EBX等,当要将EAX和EBX作为16位寄存器和8位寄存器使用的时候,他们的名字分别是什么?EFLAGS中的与算术运算最相关的标志位的名称和功能分别是什么?IA-32的三种基本运行模式是什么?为了减小CPU与内存之间交换数据的等待时间,在CPU与内存之间增加了缓存(cache)。一个好的cache替换算法能够提高命中率,那么请说出三种目前的替换算法?IA-32指令执行的五个步骤是什么?哪三个是必须的?,汇编语言程序设计-朱明,2,数据的表示方法,我们需要先回答以下的几个问题:什么是进制?他与计数之间有什么关系?如何进行任意进制数的加法和减法运算?“逢X进1”,不允许出现比X大的单位数字出现 加大了就向高位进位,减小了就从高位借位 计算机系统中常见的进制都有哪些?二进制,逢2进1,有0、1 十进制,逢10进1,有09 十六进制,逢16进1,有09、AF 计算机的内存系统中,每一个位保存的是哪种进制的数?MSB和LSB分别表示什么含义?二进制数,只有0和1两个数字 MSB最高有效位,LSB最低有效位,3,汇编语言程序设计-朱明,Section 1,数据的表示方法,我们需要先回答以下的几个问题:字节、字、双字的位数分别是多少?8位的Byte,16位的word,32位的doubleword K、M、G、T、P、E、Z、Y分别代表多大?K=210、M=220、G=230、T=240、P=250、E=260、Z=270、Y=280 各类长度有符号和无符号整数的范围是多少?无符号:8位028-1,16位0216-1,32位0232-1 有符号:有符号整数的最高位为符号位,若为1则表示是负数:8位-2727-1,16位-215215-1,32位-231231-1 任意进制如何装换到10进制?DEC=+(D1*X1)+(D0*X0),4,汇编语言程序设计-朱明,Section 1,数据的表示方法,我们需要先回答以下的几个问题:计算机中经常的字符集都有哪些?ASCII:美国标准信息交换码,7位+1位 Unicode:UTF-8,UTF-16,UTF-32 UTF-8保留了ASCII字符的编码 国际编码,通用性强:英文8位,中文24位 UTF-16是Unicode的最初设计目标,也是默认的Unicode GB2312:基于区位码的16位汉字编码 编码范围:0 xA1A1-0 x7E7E GBK:向下兼容GB2312,包括所有CJK汉字 GB18030:向下兼容GBK和GB2312,目前在文字符号方面收录较全的编码。,5,汇编语言程序设计-朱明,Section 1,数据的表示方法,ASCII字符串:一个或多个字符的序列“ABC123”、ABC123 41h,42h,43h,31h,32h,33h,空字符结尾 ASCII控制字符,部分:,汇编语言程序设计-朱明,6,Section 1,汇编语言的保留字,MASM环境中,有一些字符具有特殊的含义:指令的助记符,对于MASM来说 ADD、CALL、CMP、DEC、INC、JMP、MOV等 伪指令,用于程序的编译设置 PROC、.MMX、.DATA、.DATA?、.CODE等 属性,用于定义变量和操作数信息 BYTE、WORD、QWORD等 属性也同属于MASM的伪指令内容 预定义符号data、stack、$、Time、Version等 更多的保留字会在后面的课程中接触到,汇编语言程序设计-朱明,7,Section 2,汇编语言的标识符,MASM环境的标识符可以类比为C语言中的变量或函数,在汇编语言中使用标识符来标识程序中的变量、常量、过程或代码的标号 标识符由1127个字符组成 标识符默认大小写不敏感 可以在汇编时通过“-cP”选项设置标识符的大小写敏感 标识符必须不是任何保留字 对标识符首字符的要求 AZ、az、_、?、$尽量避免使用作为首字符,汇编语言程序设计-朱明,8,Section 2,汇编语言的伪指令,伪指令在程序运行时并不执行 汇编语言中由汇编器识别并执行相应的动作 在C语言中,宏定义由什么来识别并处理?汇编语言的伪指令可以用于定义变量、宏、过程、段的命名以及其他的汇编器相关设置 伪指令大小写是不敏感的 变量的定义要使用伪指令,汇编语言程序设计-朱明,9,numDWORD100,listBYTE10,20,30,40BYTE“Good night”,0BYTE0Ah,A,22h,Section 2,汇编语言的指令,汇编指令的基本构成:标号(可选)数据标号:数据标号标识了变量的地址 代码标号:代码标号,通常用于跳转和循环的目标地址,汇编语言程序设计-朱明,10,指令助记符,操作数,;注释,numDWORD100,loop:mov eax,12.jmploop,Section 2,标号:,汇编语言的指令,汇编指令的基本构成:指令助记符 助记符是一个简单短的、能够被汇编器识别的单词 mov,将一个值赋值到另外一个寄存器或变量中 add,加法操作 sub,减法操作 mul,乘法操作 jmp,跳转到一个新地址执行指令 call,调用一个过程,汇编语言程序设计-朱明,11,标号:,指令助记符,操作数,;注释,Section 2,moveax,3,汇编语言的指令,汇编指令的基本构成:操作数 汇编语言的操作数依汇编指令而定,一般是03个 操作数可以是寄存器、立即数或内存地址(标号)等 无操作数:单操作数:双操作数:,汇编语言程序设计-朱明,12,标号:,指令助记符,操作数,;注释,Section 2,nop,inceax,汇编指令的基本构成:注释 注释就是用自然语言描述程序以实现方便阅读等功能 汇编语言中有几种方式能够实现注释的功能,比如单行注释:块注释:,COMMENT=这是多行注释=,汇编语言的指令,汇编语言程序设计-朱明,13,标号:,指令助记符,操作数,;注释,Section 2,;这是一行注释,TITLEadd and subtract;This is a example,32-bit integersINCLUDEirvine32.inc.codemainPROCmoveax,10000h;eaxaddeax,40000h;addsubeax,20000h;subcallDumpRegsexitmainENDPENDmain,Section 3,程序范例,一个简单的加减法程序,汇编语言程序设计-朱明,14,TITLE伪指令,定义列表文件标题可以将整行标记为注释分号右边的内容将作为本行的注释注释的内容默认会被编译器忽略,TITLEadd and subtract;This is a example,32-bit integersINCLUDEirvine32.inc.codemainPROCmoveax,10000h;eaxaddeax,40000h;addsubeax,20000h;subcallDumpRegsexitmainENDPENDmain,Section 3,程序范例,一个简单的加减法程序,汇编语言程序设计-朱明,15,INCLUDE伪指令汇编时将从irvine32.inc文件中复制必要的定义信息和设置信息INCLUDE的目录在环境中已经设置,TITLEadd and subtract;This is a example,32-bit integersINCLUDEirvine32.inc.codemainPROCmoveax,10000h;eaxaddeax,40000h;addsubeax,20000h;subcallDumpRegsexitmainENDPENDmain,Section 3,程序范例,一个简单的加减法程序,汇编语言程序设计-朱明,16,.code伪指令标记代码段的开始,代码段中存放程序中的所有可执行语句,TITLEadd and subtract;This is a example,32-bit integersINCLUDEirvine32.inc.codemainPROCmoveax,10000h;eaxaddeax,40000h;addsubeax,20000h;subcallDumpRegsexitmainENDPENDmain,Section 3,程序范例,一个简单的加减法程序,汇编语言程序设计-朱明,17,PROC伪指令用于表示一个过程的开始,程序中的该过程被命名为main,TITLEadd and subtract;This is a example,32-bit integersINCLUDEirvine32.inc.codemainPROCmoveax,10000h;eaxaddeax,40000h;addsubeax,20000h;subcallDumpRegsexitmainENDPENDmain,Section 3,程序范例,一个简单的加减法程序,汇编语言程序设计-朱明,18,call可以用来调用另外一个过程DumpRegs过程是一个可以显示CPU内部所有寄存器的值的过程,TITLEadd and subtract;This is a example,32-bit integersINCLUDEirvine32.inc.codemainPROCmoveax,10000h;eaxaddeax,40000h;addsubeax,20000h;subcallDumpRegsexitmainENDPENDmain,Section 3,程序范例,一个简单的加减法程序,汇编语言程序设计-朱明,19,exit语句将间接调用irvine32函数库中的一个函数终止程序ENDP伪指令用来标记过程的结束END伪指令用来标示程序的结束,即当前行是有效程序的最后一行,汇编代码,汇编程序的代码风格,汇编语言程序设计-朱明,20,TITLEadd and subtract;This is a example,32-bit integersINCLUDEirvine32.inc.codemainPROCmoveax,10000h;eaxaddeax,40000h;addsubeax,20000h;subcallDumpRegsexitmainENDPENDmain,TITLE,.code,mov,eax,DumpRegs,Section 3,汇编程序,有关汇编语言的段:汇编语言程序以段作为组织结构(前面所讲过的代码段、数据段以及堆栈段)代码段:存放至少一个过程,并且必须有一个启动过程 启动过程:启动过程即为特殊的标号,用来标示整个代码段的开始,汇编器能够自动识别该标号,并从该标号处开始支持程序,通常该标号为“start”或“main”,并对应有该过程的结束伪指令 数据段:存放变量 堆栈段:存放子程序的参数和局部变量 汇编时将每一个段生成对应的代码段和数据段(目标文件),在连接时将所有的所有的代码段生成一个代码段,数据段整合成一个数据段,汇编语言程序设计-朱明,21,Section 3,程序执行,参考汇编语言课程系统环境设置说明 程序文件:Sect2_P22.asm 直接使用工程模板,替换工程中的源文件 运行结果如下:汇编语言工程的简单单步运行和观察调试(F10),汇编语言程序设计-朱明,22,Section 4,程序执行,汇编语言的源代码是不能够直接被执行的,汇编语言程序设计-朱明,23,汇编源代码.asm,目标文件.obj,可执行文件.exe或.com,汇编器,链接器,Section 4,程序执行,汇编语言的源代码是不能够直接被执行的,汇编语言程序设计-朱明,24,Section 4,使用文本编辑器创建源文件,源代码,文本编辑器,目标文件,列表文件,汇编编译器,链接库,可执行文件,映像文件,输出,链接器,系统 装载器,数据库文件,程序执行,汇编语言的源代码是不能够直接被执行的,汇编语言程序设计-朱明,25,Section 4,汇编器读取源文件生成目标文件,还可以生成列表文件,源代码,文本编辑器,目标文件,列表文件,汇编编译器,链接库,可执行文件,映像文件,输出,链接器,系统 装载器,数据库文件,程序执行,汇编语言的源代码是不能够直接被执行的,汇编语言程序设计-朱明,26,Section 4,链接器判断并从库中复制所需要的过程,同目标文件合并在一起生成可执行文件,源代码,文本编辑器,目标文件,列表文件,汇编编译器,链接库,可执行文件,映像文件,输出,链接器,系统 装载器,数据库文件,程序执行,汇编语言的源代码是不能够直接被执行的,汇编语言程序设计-朱明,27,Section 4,操作系统将可执行文件装入内存并从程序起始地址执行,源代码,文本编辑器,目标文件,列表文件,汇编编译器,链接库,可执行文件,映像文件,输出,链接器,系统 装载器,数据库文件,汇编语言的源代码是不能够直接被执行的 列表文件、映像文件、程序数据库文件的输出需要在工程属性中进行设置,数据库文件,映像文件,列表文件,程序执行,汇编语言程序设计-朱明,28,源代码,Section 4,文本编辑器,目标文件,汇编编译器,链接库,可执行文件,输出,链接器,系统 装载器,TITLEadd and subtract;This is a example,32-bit integersINCLUDEirvine32.inc.codemainPROCmoveax,10000h;eaxaddeax,40000h;addsubeax,20000h;subcallDumpRegsexitmainENDPENDmain,Section 5,程序改进,如何改进的加减法程序,汇编语言程序设计-朱明,29,该程序中直接使用了立即数,10000h,val1,汇编数据类型,MASM的内部数据类型:,汇编语言程序设计-朱明,30,Section 5,汇编数据定义,汇编语言的数据定义格式:数据类型同时也是数据定义的伪指令 数据的初始值:至少有一个确定的初始值,或者使用“?”以不给变量分配初始值 如果有超过一个的初始值,初始值之间用“,”分隔 传统汇编语言每行一条指令,汇编语言程序设计-朱明,31,名称,数据定义伪指令,初始值,初始值,Section 5,value2SBYTE-128word1WORD65535,54321,1,汇编数据定义,多个初始值的定义方式 MASM允许使用行延续符号“”行延续符号只能在每行最后,汇编语言程序设计-朱明,32,Section 5,.datalistsBYTE10,20BYTE30,40WORD 50,60,10,20,30,40,50,60,value offset,0000h,0001h,0003h,0002h,0004h,0006h,汇编数据定义,重复初始值的定义方式 定义字符串 一般的字符串应当以空字符结尾 字符串中可能经常用到0Dh和0Ah,分别表示回车和换行的操作,汇编语言程序设计-朱明,33,Section 5,value2BYTE20 DUP(0)BYTE20 DUP(?)BYTE3 DUP(“STACK”),strings1BYTE“hello world”,0,strings2BYTEh,e,l,存储数据DWORD:12345678h 数据的高位存储在什么样的地址单元中的区别 小尾顺序使用的更为广泛,数据存储顺序,汇编语言程序设计-朱明,34,Section 5,78,56,34,12,0001h,0000h,0002h,0003h,小尾顺序little endian,12,34,56,78,0001h,0000h,0002h,0003h,大尾顺序big endian,TITLEadd and subtract;This is a example,32-bit integersINCLUDEirvine32.inc.codemainPROCmoveax,10000h;eaxaddeax,40000h;addsubeax,20000h;subcallDumpRegsexitmainENDPENDmain,Section 5,程序改进,如何改进的加减法程序:增加变量,汇编语言程序设计-朱明,35,val1,val2,+,-,val3,=,finalVal,如何改进的加减法程序:增加变量,TITLEadd and subtract;This is a example,32-bit integersINCLUDEirvine32.inc.dataval1DWORD10000hval2DWORD40000hval3DWORD20000hfinalValDWORD?.codemainPROCmoveax,val1;eaxaddeax,val2;addsubeax,val3;submovfinalVal,eaxcallDumpRegsexitmainENDPENDmain,Section 5,程序改进,汇编语言程序设计-朱明,36,val1,val2,+,-,val3,=,finalVal,变量初始化,前面的程序中使用了如下的方式声明了变量.data用于定义已经初始化的数据段的开始(_data).data?用于定义未初始化的数据段的开始(_BSS)在定义大块的未初始化数据时,可以减小编译后的程序大小DWORD 5000 DUP(?)之后,汇编语言程序设计-朱明,37,.dataval1DWORD10000hfinalValDWORD?,.data?val1DWORD10000hfinalValDWORD?,Section 5,章节回顾,本章中以下内容是应当掌握 汇编语言指令的基本格式 计算机常用的数据表达形式 汇编语言程序的基本书写格式 汇编语言的汇编、链接和执行过程 编译和链接过程中生成的各类文件 MASM的基本数据类型和数据定义 汇编语言变量的声明和使用方法 汇编语言变量的存储和空间分配,汇编语言程序设计-朱明,38,了解和掌握,问题与回顾,章节回顾,以下的问题我们应当轻松回答 我们常用的整型常量的后缀通常是什么?什么含义?标识符是的作用是什么?标识符需要遵循什么规则?简要说明一下前面的Sect2_P22.asm中的INCLUDE伪指令、.code伪指令的作用、程序中所包含的段的名字、CPU中寄存器的显示方法、PROC、ENDP以及END三条伪指令的作用分别是什么?汇编器和链接器分别会生成什么类型的文件?如何熟练的创建各种类型的数据声明?16位有符号整数无初始值;8位无符号整数无初始值;有50个未初始值无符号双字整型的数组;包含“hello”重复500次的字符串变量;,汇编语言程序设计-朱明,39,思考问题,本章程序中的DumpRegs过程 该过程的源代码irvine32.asm中,第404行开始 还要参考Macros.inc文件,汇编语言程序设计-朱明,40,INCLUDEMacros.incDumpRegsPROC;注释的内容.data定义了数据段两个变量.code;从堆栈中获取EIP的值;将EAX、标志寄存器等内容压入堆栈(保存现场);在屏幕上输出寄存器的内容;在屏幕上输出标志位的内容;将EAX、标志寄存器等内容弹出堆栈(恢复现场)DumpRegsENDP,拓展知识,