导论第2章信息表示课件.ppt
《导论第2章信息表示课件.ppt》由会员分享,可在线阅读,更多相关《导论第2章信息表示课件.ppt(72页珍藏版)》请在三一办公上搜索。
1、2022/12/5,中山大学计算机科学系,第2章,信息表示技术基础,2022/12/5,中山大学计算机科学系,第2章 信息表示技术基础,数制及转换数值型数据的表示及运算字符编码技术数据压缩,2022/12/5,中山大学计算机科学系,2.1 数制及转换,2.1.1 进位计数制数制:也称计数制,是指用一组固定的符号和统一的规则来表示数值的方法。进位计数制:按进位的方法进行计数。例如,十进制、二进制、八进制和十六进制等。进位计数制三要素数位:如个、十、百、千、万位等。基数:数码个数,逢基数进一。位权:与数位相关的一个固定数值。例如,十进制数的个位位权为100=1,十位为101=10,百位为102=1
2、00 而小数点后的位权依次为10-1、10-2 等;对于二进制数101.01,其位权依次是22、21、20、2-1、2-2。,2022/12/5,中山大学计算机科学系,2.1 数制及转换,常见进位计数制,2022/12/5,中山大学计算机科学系,2.1 数制及转换,位权展开式用于把任何一个R进制数N转换为等值的十进制数:其中:i=0,1,2,3, Ri为第i位的位权,ai为第i位数码所对应的十进制数(或称系数)。,2022/12/5,中山大学计算机科学系,2.1 数制及转换,2.1.2 将非十进制数转换为十进制数方法:采用位权展开式示例:(1011.101)2 = 123+022+121+12
3、0+ 12-1+02-2+12-3 = (11.625)10 (143) 8 = 182+481+380 = (99)10 (FA59)16 = 15163+10162+5161+9160 = (64089)10,2022/12/5,中山大学计算机科学系,2.1 数制及转换,2.1.3 将十进制数转换为非十进制数基本方法:将整数部分和小数部分分别进行转换,然后再将它们合并起来。一、对于整数部分,采用除R取余数倒排法:例2.2,(89)10 (1011001)2 ,采用“除2取余倒排法”,2022/12/5,中山大学计算机科学系,2.1 数制及转换,例2.3,(219)10 (DB)16 ,采用
4、“除16取余倒排法”,2022/12/5,中山大学计算机科学系,2.1 数制及转换,二、对于小数部分,采用乘R取整顺排法例2.4,(0.3125)10 (0.0101)2 , 采用“乘2取整顺排法”,2022/12/5,中山大学计算机科学系,2.1 数制及转换,2.1.4 非十进制数之间的转换(一)二进制转换为八进制十六进制方法:3位合1位(或4位合1位),不足补0 例2.5,2022/12/5,中山大学计算机科学系,2.1 数制及转换,(二)八进制十六进制转换为二进制方法: “一分为三”(或 “一分为四”),去除头尾多余的0。例2.6,2022/12/5,中山大学计算机科学系,2.2 数值型
5、数据的表示及运算,2.2.1 二进制的基本运算一、算术运算二进制加、减运算规则:逢二进一,借一当二例2.7,2022/12/5,中山大学计算机科学系,2.2 数值型数据的表示及运算,二、逻辑运算逻辑或:00=0 01=1 10=1 11=1逻辑与:00=0 01=0 10=0 11=1非运算:0的非是1,1的非是0。异或运算:例2.8,2022/12/5,中山大学计算机科学系,2.2 数值型数据的表示及运算,2.2.2 机器数与真值机器数:数值在计算机中的二进制表示形式,包括数的正、负符号和小数点。真值:机器数所代表的一般数学意义上用正负号和数字符号表示的实际数值。数符:机器数的最高位通常定义
6、为符号位,表示数的正负号,一般0表示正号“+”,1表示负号“”。其余位则表示数值的大小。如:(0110101)2表示为:,2022/12/5,中山大学计算机科学系,2.2 数值型数据的表示及运算,2.2.3 整数和实数的表示方法定点数和浮点数:在计算机内部,并不显式地表示出小数点,而是通过对小数点的位置加以规定来表示。根据数中小数点的位置是否固定,可把机器数分为定点数和浮点数两种表示方法。通常,使用定点数表示整数,而用浮点数表示实数。,2022/12/5,中山大学计算机科学系,2.2 数值型数据的表示及运算,一、整数整数没有小数部分,因此可以认为小数点固定在数的最右边。整数分为:无符号整数:所
7、有二进制位表示数值的大小有符号整数:最高位表示数的正负号,其他位表示数值的大小。如,65的一种机内表示是:整数表示的数值是精确的,但数值范围受机器字长的限制。,2022/12/5,中山大学计算机科学系,2.2 数值型数据的表示及运算,二、实数基本表示方法:用阶码和尾数来表示。如: 0.3429106 尾数 阶码为什么称为浮点数表示法?由于阶码可以取不同数值,使得小数点的位置不固定,从而可以有多种形式表示同一个实数。例如,1010.1011可以表示为:10.101011210 101010.11210 0.101010112+100,2022/12/5,中山大学计算机科学系,2.2 数值型数据的
8、表示及运算,浮点数机内表示形式尾数:表示数值的有效数字,当尾数不为0时,其绝对值大于等于0.5(注:因为是二进制数,要求尾数的第1位必须是1 )且小于1。阶码:用来指示尾数中的小数点应当向左或向右移动的位数。例如,设机器字长为16位,尾数为8位,阶码为6位,则二进制实数1101.010 = 0.1101012100,其机内表示形式如下:,2022/12/5,中山大学计算机科学系,2.2 数值型数据的表示及运算,2.2.4 原码、反码和补码机器数的编码方法有多种,最常用的是原码、反码和补码。一、原码编码规则:符号位0表示正,1表示负,数值部分用该数绝对值的二进制数表示。例如:原码易于乘除运算,但
9、不易于加减运算,且零有两种表示形式,2022/12/5,中山大学计算机科学系,2.2 数值型数据的表示及运算,二、反码编码规则:符号位0表示正,1表示负,正数的反码等于原码,负数的反码等于原码除符号位外按位取反,即0变1、1变0。例如:反码不方便运算,且零也有两种表示形式,一般在求补码的过程中用到反码。,2022/12/5,中山大学计算机科学系,2.2 数值型数据的表示及运算,三、补码编码规则:符号位0表示正,1表示负,正数的补码等于原码,负数的补码等于其反码末位加1。例如:例2.9,求X=+1011,Y=1101的原码、反码和补码:补码易于加减运算,且零有唯一的表示形式,2022/12/5,
10、中山大学计算机科学系,2.2 数值型数据的表示及运算,四、BCD码BCD码:用一组4位二进制码来表示1位十进制数的编码方法,也称作二十进制码。通常是指8421 BCD码。例2.10,2022/12/5,中山大学计算机科学系,2.2 数值型数据的表示及运算,2.2.5 数值运算一、补码运算采用补码进行加减运算十分方便。通过对负数的编码处理,允许符号位和数值一起参与运算,可以把减法运算转化为加法运算。不论求和、求差,也不论操作数为正、为负,运算时一律只做加法,从而大大简化运算器的设计。,2022/12/5,中山大学计算机科学系,2.2 数值型数据的表示及运算,例2.11 通过补码计算9+5、95、
11、9+5和95,2022/12/5,中山大学计算机科学系,2.2 数值型数据的表示及运算,2022/12/5,中山大学计算机科学系,2.2 数值型数据的表示及运算,二、移位运算移位的意义移位运算运算相当于乘 2n 运算可以采用移位和加法相结合,实现乘/除运算移位运算分为:算术移位:对有符号数的移位逻辑移位:对无符号数的移位,2022/12/5,中山大学计算机科学系,2.2 数值型数据的表示及运算,算术移位规则不论是正数还是负数,移位后其符号位均不变,只对数值位进行移位(见下表)。,2022/12/5,中山大学计算机科学系,2.2 数值型数据的表示及运算,示例:正数+26在不同码制下的移位,202
12、2/12/5,中山大学计算机科学系,2.2 数值型数据的表示及运算,示例:负数-26在不同码制下的移位,2022/12/5,中山大学计算机科学系,2.2 数值型数据的表示及运算,逻辑移位规则逻辑左移时,高位移出,低位添0;逻辑右移时,低位移出,高位添0。例如,对于01010011,逻辑左移1位为10100110;对于10110010,逻辑右移1位为01011001。,2022/12/5,中山大学计算机科学系,2.2 数值型数据的表示及运算,三、精度和溢出精度:可以给出的有效数字的位数。机器字长越长,可以表示的数的范围越大,精度越高。溢出:一个数的大小超出了计算机所能表示的数的范围。上溢:两个正
13、数相加,结果大于机器所能表示的最大正数。下溢:两个负数相加,结果小于机器所能表示的最小负数。程序状态字寄存器(PSW):标记溢出(即将其溢出标志位自动置为1,否则为0)。,2022/12/5,中山大学计算机科学系,2.3 字符编码技术,2.3.1 字符编码的基本知识字符是各种文字和符号的总称,包括各国文字、标点符号、图形符号、数字以及一般不可见的控制符等字符编码是指将字符表示为一个二进制数。字符集是字符的集合,也称为编码字符集,强调字符集为每个字符分配一个唯一整数。代码点是指可用于编码字符集的整数。由编码字符集定义的代码点整数取值范围称为编码空间。每个代码点表示一个字符或被声明为未使用。,20
14、22/12/5,中山大学计算机科学系,2.3 字符编码技术,字符编码方案:是从编码空间的每个代码点到1个或多个固定宽度编码单元序列的映射。编码单元:表示代码点整数的基本二进制位序列,一般为8位、16位或32位。最终将转换为字节序列。字节序(Endian ):是指多字节整数在内存中的存放顺序,分为:大序(Big-Endian):高位在前,低位在后。例如,将整数6C49H编排为字节序列 6C 49小序(Little-Endian):低位在前,高位在后。例如,将整数6C49H编排为字节序列 49 6C字符的编码过程: 分配代码点用1个或多个编码单元表示字节序列,2022/12/5,中山大学计算机科学
15、系,2.3 字符编码技术,2.3.2 十六进制编辑器简介Hex编辑器能够以字节和二进制位为单位来修改文件。由于任何文件可看成字节流,因此Hex编辑器可查看、编辑任何文件的二进制表示WinHex简介,2022/12/5,中山大学计算机科学系,2.3 字符编码技术,2.3.3 ASCII码及其ANSI扩展ASCII码是美国信息交换标准码(American Standard Code for Information Interchange)的简称,用于编码国际上最通用的西文字符。ASCII码一般使用8位(1个字节)编码单元表示字符,最高位恒为0,只用低7位对字符进行编码,能表示27=128种字符。A
16、SCII字符集包括26个大写字母AZ、26个小写字母az、10个数字09、32个标点符号和运算符、1个空格(码值32)以及33个控制字符。,2022/12/5,中山大学计算机科学系,2.3 字符编码技术,每个ASCII码由一个高3位组 b6b5b4 和一个低4位组b3b2b1b0 构成。例如,回车符(CR)的ASCII码是 000 1101,2022/12/5,中山大学计算机科学系,2.3 字符编码技术,例2.12 验证编辑文本文档时通过按回车键产生的换行符通常称为回车换行符(CR/LF)。启动“记事本”,输入“abc”、回车键、 “ABC”,存盘启动 WinHex 编辑器,打开第1步保存的
17、文件。中间2个字节0D、0A分别是回车符(CR)和换行符(LF)的十六进制数表示,2022/12/5,中山大学计算机科学系,2.3 字符编码技术,ASCII扩展字符集由于ASCII码只使用单字节编码单元中的低7位,因此ASCII码可被扩展。ANSI 扩展标准:ASCII扩展字符集仍然使用单字节编码单元,要求ASCII码必须用1个等值的高位为0的编码单元表示,但对于其他高位为1的编码单元则依赖于特定字符集的具体定义ANSI 字符集 :是指按ANSI标准派生的ASCII扩展字符集,如:Latin-1、GB2312、Big-5等。有时也称为多字节字符集(简称MBCS)。,2022/12/5,中山大学
18、计算机科学系,2.3 字符编码技术,2.3.4 汉字编码 常用编码:GB2312、BIG-5、GBK和GB180302.3.4.1 GB2312一、国标字符集与区位码GB2312字符集包括6763个常用简体汉字和682个图形符号,并为每个字符给出国标码和区位码。所有字符排成一个9494的矩阵,矩阵中每一行称为一个区,每一列称为一个位。矩阵中的每个字符可用区码和位码表示,称为区位码。,2022/12/5,中山大学计算机科学系,2.3 字符编码技术,区位码也是一种汉字输入码。例如,在“区位输入法”(或称“内码输入法”)状态下输入0102、0103、0104可输入全角符号“、。”输入1601、160
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 导论 信息 表示 课件

链接地址:https://www.31ppt.com/p-1556466.html