《数据的机器层次表示(终).ppt》由会员分享,可在线阅读,更多相关《数据的机器层次表示(终).ppt(89页珍藏版)》请在三一办公上搜索。
1、1,中国计算机学会“21世纪大学本科计算机专业系列教材”计算机组成原理,2,第2章数据的机器层次表示,3,本章学习内容,2.1 数值数据的表示2.2 机器数的定点表示和浮点表示2.3 非数值数据的表示2.4 十进制数和数串的表示2.5 现代微型计算机中的数据表示举例2.6 数据校验码,4,本章学习要求,了解:无符号数与带符号数,真值和机器数等概念 掌握:原码、补码、反码表示法以及三种码制与真值之间的转换方法 掌握:定点数和浮点数的表示范围理解:浮点数阶码的移码了解:IEEE754浮点数标准掌握:常见的字符编码方法(ASCII码)、汉字国标码、区位码、机内码掌握:8421码、2421码和余3码掌
2、握:奇偶校验位及其形成方法了解:海明校验码和循环冗余校验码,5,2.1 数值数据的表示,数据有无符号数和带符号数之分。带符号数根据其编码的不同又有 原码、补码和反码3种形式。,6,2.1.1 计算机中的数值数据,二进制数:后缀B八进制数:后缀Q十进制数:后缀D或省略后缀十六进制数:后缀H,7,2.1.2 无符号数和带符号数,无符号数,就是整个机器字长的全部二进制位均表示数值位(没有符号位),相当于数的绝对值。例如:N1=01001 表示无符号数9 N2=11001 表示无符号数25 机器字长为n+1位的无符号数的表示范围是0(2n+1-1),此时二进制的最高位也是数值位,其权值等于2n。若字长
3、为8位,则数的表示范围为0255。,8,2.1.2 无符号数和带符号数(续),用“+”、“-”号加绝对值来表示数值的大小,用这种形式表示的数值在计算机技术中称为“真值”。约定二进制数的最高位为符号位,“0”表示正号,“1”表示负号。这种在计算机中使用的表示数的形式称为机器数。,9,2.1.2 无符号数和带符号数(续),常见的机器数有原码、反码、补码等3种不同的表示形式。带符号数的最高位被用来表示符号位,而不再表示数值位。N1=01001 表示+9。N2=11001 表示9。,10,2.1.3 原码表示法,原码表示法是一种最简单的机器数表示法,用最高位表示符号位,符号位为“0”表示该数为正,符号
4、位为“1”表示该数为负,数值部分与真值相同。设二进制纯小数的原码形式为Xs.X1X2Xn,字长n+1位,其中Xs表示符号位。例1:X1=0.0110,X1原=0.0110 X2=-0.0110,X2原=1.0110,11,2.1.3 原码表示法(续),设二进制纯整数的原码形式为XsX1X2Xn,其中Xs表示符号位。例2:X1=1101,X1原=01101 X2=-1101,X2原=11101 在原码表示中,真值0有两种不同的表示形式:+0原=00000-0原=10000,12,补码的符号位表示方法与原码相同,其数值部分的表示与数的正负有关:对于正数,数值部分与真值形式相同;对于负数,将真值的数
5、值部分按位取反,且在最低位上加1。若真值为纯小数,它的补码形式为Xs.X1X2Xn,其中Xs表示符号位。例5:X1=0.0110,X1补=0.0110 X2=-0.0110,X2补=1.1010,2.1.4 补码表示法,13,若真值为纯整数,它的补码形式为XsX1X2Xn,其中Xs表示符号位。例6:X1=1101,X1补=01101 X2=-1101,X2补=10011 在补码表示中,真值0的表示形式是唯一的:+0补=-0补=00000,2.补码表示(续),14,当X为正数时,X补=X原=X 当X为负数时,由X原转换为X补的方法:X原除掉符号位外的各位取反加“1”。自低位向高位,尾数的第一个“
6、1”及其右部的“0”保持不变,左部的各位取反,符号位保持不变。例7:X原=1.1110011000 X补=1.0001101000,3.由真值、原码转换为补码,15,2.1.5 反码表示法,反码表示法与补码表示法有许多类似之处,对于正数,数值部分与真值形式相同;对于负数,将真值的数值部分按位取反。若真值为纯小数,它的反码形式为Xs.X1X2Xn,其中Xs表示符号位。例9:X1=0.0110,X1反=0.0110 X2=-0.0110,X2反=1.1001,16,2.1.5 反码表示法(续),若真值为纯整数,它的反码形式为XsX1X2Xn,其中Xs表示符号位。例10:X1=1101,X1补=01
7、101 X2=-1101,X2补=10010 在反码表示中,真值0也有两种不同的表示形式:+0反=00000-0反=11111,17,1.比较对于正数它们都等于真值本身,而对于负数各有不同的表示。最高位都表示符号位,补码和反码的符号位可作为数值位的一部分看待,和数值位一起参加运算;但原码的符号位不允许和数值位同等看待,必须分开进行处理。对于真值0,原码和反码各有两种不同的表示形式,而补码只有唯一的一种表示形式。原码、反码表示的正、负数范围相对零来说是对称的;但补码负数表示范围较正数表示范围宽,能多表示一个最负的数(绝对值最大的负数),其值等于-2n(纯整数)或-1(纯小数)。,2.1.6 三种
8、码制的比较与转换,18,真值与3种机器数间的对照,19,2.转换,如果已知机器的字长,则机器数的位数应补够相应的位。例如,设机器字长为8位,则:X1=1011 X2=-1011 X1原=00001011 X2原=10001011 X1补=00001011 X2补=11110101 X1反=00001011 X2反=11110100 X3=0.1011 X4=-0.1011 X3原=0.1011000 X4原=1.1011000 X3补=0.1011000 X4补=1.0101000 X3反=0.1011000 X4反=1.0100111,20,2.2 机器数的定点表示与浮点表示,计算机在进行算
9、术运算时,需要指出小数点的位置。根据小数点的位置是否固定,在计算机中有两种数据格式:定点表示和浮点表示。,21,2.2.1 定点表示法,在定点表示法中约定:所有数据的小数点位置固定不变。1.定点小数 小数点的位置固定在最高有效数位之前,符号位之后,记作Xs.X1X2Xn,这个数是一个纯小数。定点小数的小数点位置是隐含约定的,小数点并不需要真正地占据一个二进制位。,22,定点小数表示范围,图2-2 定点小数格式 当Xs=0,X1Xn=1时,X为最大正数。X最大正数=1-2-n 当Xn=1,XsXn-1=0时,X为最小正数。X最小正数=2-n,23,定点小数表示范围(续),当Xs=1,表示X为负数
10、,此时情况要稍微复杂一些,这是因为在计算机中带符号数可用补码表示,也可用原码表示。原码和补码的表示范围有一些差别。若机器数为原码表示,当XsXn均等于1时,X为绝对值最大的负数。X绝对值最大负数=-(1-2-n)若机器数为补码表示,当Xs=1,X1Xn均等于0时,X为绝对值最大的负数。X绝对值最大负数=-1,24,若机器字长有n+1位,则有:原码定点小数表示范围:-(1-2-n)(1-2-n)补码定点小数表示范围:-1(1-2-n)若机器字长有8位,则有:原码定点小数表示范围:-补码定点小数表示范围:-1,定点小数表示范围(续),25,2.定点整数,定点整数即纯整数,小数点位置隐含固定在最低有
11、效数位之后,记作XsX1X2Xn。图2-3 定点整数格式,26,若机器字长有n+1位,则有:原码定点整数的表示范围:-(2n-1)(2n-1)补码定点整数的表示范围:-2n(2n-1)若机器字长有8位,则有:原码定点整数表示范围:-127127补码定点整数表示范围:-128127,定点整数表示范围,27,小数点的位置根据需要而浮动,这就是浮点数。例如:N=MrE 式中:r为浮点数阶码的底,与尾数的基数相同,通常r=2。E和M都是带符号数,E叫做阶码,M叫做尾数。在大多数计算机中,尾数为纯小数,常用原码或补码表示;阶码为纯整数,常用移码或补码表示。,2.2.2 浮点表示法,28,图2-5 浮点数
12、的一般格式 浮点数的底是隐含的,在整个机器数中不出现。阶码的符号位为es,阶码的大小反映了在数N中小数点的实际位置;尾数的符号位为ms,它是整个浮点数的符号位,表示了该浮点数的正负。,浮点数的一般格式,29,1.浮点数的表示范围,当es=0,ms=0,阶码和尾数的数值位各位全为1(即阶码和尾数都为最大正数)时,该浮点数为最大正数:X最大正数=(1-2-n)当es=1,ms=0,尾数的最低位mn=1,其余各位为0(即阶码为绝对值最大的负数,尾数为最小正数)时,该浮点数为最小正数:X最小正数=2-n,30,1.浮点数的表示范围(续),当es=0,阶码的数值位为全1;ms=1,尾数的数值位为全0(即
13、阶码为最大正数,尾数为绝对值最大的负数)时,该浮点数为绝对值最大负数:X绝对值最大负数=-1,31,为了提高运算的精度,需要充分地利用尾数的有效数位,通常采取浮点数规格化形式,即规定尾数的最高数位必须是一个有效值。1/2|M|1,2.规格化浮点数,32,2.规格化浮点数(续),在尾数用补码表示时,规格化浮点数应满足尾数最高数位与符号位不同(msm1=1),即当1/2M1时,应有0.1xxx形式,当-1M-1/2时,应有1.0 xxx形式。需要注意的是当M=-1/2,对于原码来说,是规格化数,而对于补码来说,不是规格化数。,33,2.规格化浮点数(续),当es=1,ms=0,尾数的最高位m1=1
14、,其余各位为0时,该浮点数为规格化的最小正数:X规格化的最小正数=2-1 规格化的最小正数大于非规格化的最小正数。,34,浮点数的典型值,35,2.2.3 移码表示法,移码就是在真值X上加一个常数(偏置值),相当于X在数轴上向正方向平移了一段距离,这就是“移码”一词的来由。X移=偏置值+X 对于字长8位的定点整数,偏置值为27。例11:X=1011101 X移=27+X=10000000+1011101=11011101 X补=01011101 例12:X=-1011101 X移=27+X=10000000-1011101=00100011 X补=10100011,36,偏置值为27的移码、补
15、码和真值之间的关系,37,偏置值为2n的移码的特点,在移码中,最高位为“0”表示负数,最高位为“1”表示正数。移码为全0时,它所对应的真值最小,为全1时,它所对应的真值最大。真值0在移码中的表示形式是唯一的,即+0移=-0移=1000。移码把真值映射到一个正数域,所以可将移码视为无符号数,直接按无符号数规则比较大小。同一数值的移码和补码除最高位相反外,其他各位相同。,38,浮点数的阶码采用移码的原因,便于比较浮点数的大小。阶码大的,其对应的真值就大,阶码小的,对应的真值就小。简化机器中的判零电路。当阶码全为0,尾数也全为0时,表示机器零。,39,1.定点、浮点表示法的区别数值的表示范围 假设定
16、点数和浮点数的字长相同,浮点表示法所能表示的数值范围将远远大于定点数。精度 对于字长相同的定点数和浮点数来说,浮点数虽然扩大了数的表示范围,但这正是以降低精度为代价的,也就是数轴上各点的排列更稀疏了。,2.2.4 定点、浮点表示法和定点、浮点计算机,40,数的运算 浮点运算要比定点运算复杂得多。溢出处理 在定点运算时,当运算结果超出数的表示范围,就发生溢出。而在浮点运算时,运算结果超出尾数的表示范围却并不一定溢出,只有当阶码超出所能表示的范围时,才发生溢出。,1.定点、浮点表示法的区别(续),41,2.定点机与浮点机,通常可以将计算机分为几档:定点机 以定点运算为主,浮点运算是通过软件来实现的
17、。定点机浮点运算部件 浮点运算部件是专门用于对浮点数进行运算的部件。浮点机 具有浮点运算指令和基本的浮点运算器。,42,图2-6 IEEE 754标准的浮点数格式,2.2.6 实用浮点数举例,43,IEEE754标准的浮点数,以短浮点数为例讨论浮点代码与其真值之间的关系。最高位为数符位;其后是8位阶码,以2为底,阶码的偏置值为127;其余23位是尾数。为了使尾数部分能表示更多一位的有效值,IEEE754采用隐含尾数最高数位1(即这一位1不表示出来)的方法,因此尾数实际上是24位。应注意的是,隐含的1是一位整数(即位权为20),在浮点格式中表示出来的23位尾数是纯小数,并用原码表示。,44,IE
18、EE754标准的浮点数(续),例13:将(100.25)10转换成短浮点数格式。十进制数二进制数(100.25)10=(1100100.01)2 非规格化数规格化数 1100100.01=1.1001000126 计算移码表示的阶码(偏置值阶码真值)1111111+110=10000101 以短浮点数格式存储该数。符号位=0 阶码=10000101,45,IEEE754标准的浮点数(续),短浮点数代码为 0;100 0010 1;100 1000 1000 0000 0000 0000 表示为十六进制的代码:42C88000H。例14:把短浮点数C1C90000H转换成为十进制数。十六进制二进
19、制形式,并分离出符号位、阶码和尾数。C1C90000H=1;10000011;,46,IEEE754标准的浮点数(续),计算出阶码真值(移码偏置值)10000011-1111111=100 以规格化二进制数形式写出此数 1.100100124 写成非规格化二进制数形式 11001.001 转换成十进制数,并加上符号位。(11001.001)2=(25.125)10 所以,该浮点数=-25.125,47,2.3 非数值数据的表示,非数值数据,又称为字符数据,通常是指字符、字符串、图形符号和汉字等各种数据,它们不用来表示数值的大小,一般情况下不对它们进行算术运算。,48,2.3.1 字符和字符串的
20、表示,1.ASCII字符编码 常见的ASCII码用七位二进制表示一个字符,它包括10个十进制数字(09)、52个英文大写和小写字母(AZ,az)、34个专用符号和32个控制符号,共计128个字符。在计算机中,通常用一个字节来存放一个字符。在ASCII码表中,数字和英文字母都是按顺序排列的,只要知道其中一个的二进制代码,不要查表就可以推导出其他数字或字母的二进制代码。,49,ASCII字符编码表,50,2.字符串的存放,字符串是指一串连续的字符。例如,字符串IF X0 THEN READ(C)。向量存放法在存储器中占用一片连续的空间,每个字节存放一个字符代码,字符串的所有元素(字符)在物理上是邻
21、接的。在字长为32位的存储器,每一个主存单元可存放4个字符,整个字符串需5个主存单元。在每个字节中实际存放的是相应字符的ASCII码。,51,字符串的向量存放方案,图2-7 字符串的向量存放方案,52,1.汉字国标码 汉字国标码亦可称为汉字交换码,主要用于汉字信息处理系统之间或者通信系统之间交换信息使用,简称GB码。该标准共收集常用汉字6 763个,另外还有各种图形符号682个,共计7 445个。GB码规定每个汉字、图形符号都用两个字节表示,每个字节只使用低七位编码,因此最多能表示出128128=16 384个汉字。,2.3.2 汉字的表示,53,区位码将汉字编码码中的6 763个汉字分为94
22、个区,每个区中包含94个汉字(位),区和位组成一个二维数组,每个汉字在数组中对应一个唯一的区位码。汉字的区位码定长4位,前2位表示区号,后2位表示位号,区号和位号用十进制数表示,区号从01到94,位号也从01到94。例如,“中”字在54区的48位上,其区位码为“54-48”,“国”字在25区的90位上,其区位码为“25-90”。,2.汉字区位码,54,需要注意的是:汉字区位码并不等于汉字国标码,它们两者之间的关系可用以下公式表示:国标码区位码(十六进制)2020H 例15:已知汉字“春”的区位码为“20-26”,计算它的国标码。区位码:第1字节 第2字节 20 26 十进制 14H 1AH 十
23、六进制+20H+20H 国标码:34H 3AH,2.汉字区位码(续),55,汉字在计算机内部其内码是唯一的。因为汉字处理系统要保证中西文的兼容,当系统中同时存在ASCII码和汉字国标码时,将会产生二义性。例如:有两个字节的内容为30H和21H,它既可表示汉字“啊”的国标码,又可表示西文“0”和“!”的ASCII码。为此,汉字机内码应对国标码加以适当处理和变换。GB码的机内码为二字节长的代码,它是在相应GB码的每个字节最高位上加“1”,即 汉字机内码汉字国标码8080H 例如,上述“啊”字的国标码是3021H,其汉字机内码则是B0A1H。,3.汉字机内码,56,Unicode的基本方法是用一个1
24、6位的数来表示每个符号,这种符号集可表示65536个不同的字符或符号。被称为基本多语言平面(BMP)。这个空间已经非常大了,但设计者考虑到将来某一天它可能也会不够用,所以采用了一种可使这种表示法使用得更远的方法。,2.3.3 统一代码,57,当用两字节来表示Unicode字符时,使用的是UCS-2编码,但尽管如此,也允许在UCS-2文本中插入一些UCS-4字符。为此,在BMP中,保留了两个大小为1024的块,这两个块中任何位置都不能用来表示任何符号。UCS-4的两个16位字每个表示一个数,这个数是UCS-2 BMP中1024个数值中的一个。这两个数的组合可以表示多达100多万个自定义的UCS-
25、4字符。,2.3.3 统一代码(续),58,PC机中表示符号的3种方法,图2-8 PC机中表示符号的3种方法,59,2.4 十进制数和数串的表示,十进制是人们最常用的数据表示方法,一些通用性较强的计算机上设有十进制数据的表示,可以直接对十进制数进行运算和处理。,60,2.4.1 十进制数的编码,用四位二进制数来表示一位十进制数,称为二进制编码的十进制数,简称BCD码。四位二进制数可以组合出16种代码,能表示16种不同的状态,我们只需要使用其中的10种状态,就可以表示十进制数的09十个数码,而其他的六种状态为冗余状态。由于可以取任意的10种代码来表示十个数码,所以就可能产生多种BCD编码。BCD
26、编码既具有二进制数的形式,又保持了十进制数的特点。,61,几种常见的BCD码,62,1.8421码,8421码又称为NBCD码,其主要特点是:它是一种有权码,四位二进制代码的位权从高到低分别为8、4、2、1。简单直观。每个代码与它所代表的十进制数之间符合二进制数和十进制数相互转换的规则。不允许出现10101111。这6个代码在8421码中是非法码。,63,2.2421码,2421码的主要特点是:它也是一种有权码,四位二进制代码的位权从高到低分别为2、4、2、1。它又是一种对9的自补码。即某数的2421码,只要自身按位取反,就能得到该数对9之补的2421码。例如:3的2421码是0011。3对9
27、之补是6,而6的2421码是1100。不允许出现01011010。这6个代码在2421码中是非法码。,64,3.余3码,余3码的主要特点是:这是一种无权码,但也可看作是一种特殊的有权码,即在8421码的基础上加+3(+0011)形成的,故称余3码。在这种编码中各位的“1”不表示一个固定的十进制数值,因而不直观。它也是一种对9的自补码。不允许出现00000010、11011111。这6个代码在余3码中是非法码。,65,2.4.2 十进制数串,1.非压缩的十进制数串 非压缩的十进制数串中一个字节存放一个十进制数或符号的ASCII-7码。非压缩的十进制数串又分成前分隔式数字串和后嵌入式数字串两种格式
28、。在前分隔式数字串中,符号位占用单独一个字节,放在数值位之前,正号对应的ASCII码为2BH,负号对应的ASCII码为2DH。在后嵌入式数字串中,符号位不单独占用一个字节,而是嵌入到最低一位数字里边去。若数串为正,则最低一位数字09的ASCII码不变(30H39H);若数串为负,把负号变为40H,并将其与最低数值位相加,此时数字09的ASCII码变为70H79H。,66,2.压缩的十进制数串,压缩的十进制数串,一个字节可存放两位BCD码表示的十进制数,既节省了存储空间,又便于直接进行十进制算术运算。在主存中,一个压缩的十进制数串占用连续的多个字节,每位数字仅占半个字节,其值常用8421码表示。
29、符号位也占半个字节,并存放在最低数值位之后,通常用CH表示正号,DH表示负号。在这种表示中,规定数字的个数加符号位之和必须为偶数;当和为奇数时,应在最高数值位之前补0H(即第一个字节的高半字节为“0000”)。,67,2.5 现代微机系统中的数据表示举例,现代的微机系统大多采用Intel系列的微处理器,近年来,Intel的微处理器有了极大的发展,形成了IA-32结构。IA-32结构的基本数据类型是字节、字、双字、四字和双四字。,68,IA-32结构的基本数据类型,图2-9 IA-32结构的基本数据类型,69,1.无符号整数,无符号整数是包含字节、字、双字和四字的无符号的二进制数。无符号整数的范
30、围,对于字节,从0255;对于字,从065535;对于双字,从0232-1;对于四字,从0264-1。2.带符号整数 带符号整数是包含字节、字、双字和四字的带符号的二进制定点整数。正数的符号位为0,负数的符号位为1。对于字节,从-128+127;对于字,从-32768+32767;对于双字,从-231+231-1;对于四字,从-263+263-1。,70,3.浮点数,与IEEE 754标准所规定的格式直接对应。4.指针数据 指针是主存单元的地址,IA-32 结构定义了两种类型的指针:近指针(32位)和远指针(48位)。5.串数据 包括位串、字节串、字串和双字串。一个串可以包含从一个字节到4GB
31、的内容。,71,6.BCD数,IA-32 结构中所指的BCD码实际上是指8421码。BCD数又分成未拼装的BCD(UBCD)数和拼装的BCD数两种。UBCD数的一个字节仅包含一位十进制数,在30位上;而经过拼装的BCD数,一个字节包含两位十进制数,其低位在30位上,高位在74位上。,72,2.6 数据校验码,数据校验码是指那些能够发现错误或能够自动纠正错误的数据编码,又称之为“检错纠错编码”。任何一种编码都由许多码字构成,任意两个码字之间最少变化的二进制位数,被称为数据校验码的码距。例如,用四位二进制表示16种状态,则有16个不同的码字,此时码距为1,即两个码字之间最少仅有一个二进制位不同(如
32、0000与0001之间)。这种编码没有检错能力,因为当某一个合法码字中有一位或几位出错,就变成为另一个合法码字了。,73,2.6.1 奇偶校验码,1.奇偶校验概念 奇偶校验码是一种最简单的数据校验码,它的码距等于2,可以检测出一位错误(或奇数位错误),但不能确定出错的位置,也不能检测出偶数位错误。奇偶校验实现方法是:由若干位有效信息(如一个字节),再加上一个二进制位(校验位)组成校验码。图2-11 奇偶校验码,74,奇偶校验规律,校验位的取值(0或1)将使整个校验码中“1”的个数为奇数或偶数,所以有两种可供选择的校验规律:奇校验整个校验码(有效信息位和校验位)中“1”的个数为奇数。偶校验整个校
33、验码中“1”的个数为偶数。,75,2.简单奇偶校验,简单奇偶校验仅实现横向的奇偶校验,下表给出几个字节的奇偶校验码的编码结果。最高一位为校验位,其余8位为信息位。在实际应用中,多采用奇校验,因为奇校验中不存在全“0”代码,在某些场合下更便于判别。,76,2.简单奇偶校验(续),校验位形成 当要把一个字节的代码D7D0写入主存时,就同时将它们送往奇偶校验逻辑电路,该电路产生的“奇形成”信号就是校验位。它将与8位代码一起作为奇校验码写入主存。若D7D0中有偶数个“1”,则“奇形成”=1,若D7D0中有奇数个“1”,则“奇形成”=0。,77,奇偶校验位的形成及校验电路,图2-12 奇偶校验位的形成及
34、校验电路,78,2.简单奇偶校验(续),校验检测 读出时,将读出的9位代码(8位信息位和1位校验位)同时送入奇偶校验电路检测。若读出代码无错,则“奇校验出错”=0;若读出代码中的某一位上出现错误,则“奇校验出错”=1,从而指示这个9位代码中一定有某一位出现了错误,但具体的错误位置是不能确定的。,79,3.交叉奇偶校验,计算机在进行大量字节(数据块)传送时,不仅每一个字节有一个奇偶校验位做横向校验,而且全部字节的同一位也设置一个奇偶校验位做纵向校验,这种横向、纵向同时校验的方法称为交叉校验。第1字节 1 1 0 0 1 0 1 1 1 第2字节 0 1 0 1 1 1 0 0 0 第3字节 1
35、0 0 1 1 0 1 0 0 第4字节 1 0 0 1 0 1 0 1 0 1 0 0 1 1 0 0 0,80,3.交叉奇偶校验(续),交叉校验可以发现两位同时出错的情况,假设第2字节的A6、A4两位均出错,横向校验位无法检出错误,但是第A6、A4位所在列的纵向校验位会显示出错,这与前述的简单奇偶校验相比要保险多了。,81,2.6.2 海明校验码,海明码实际上是一种多重奇偶校验,其实现原理是:在有效信息位中加入几个校验位形成海明码,使码距比较均匀地拉大,并把海明码的每一个二进制位分配到几个奇偶校验组中。当某一位出错后,就会引起有关的几个校验位的值发生变化,这不但可以发现错误,还能指出错误的
36、位置,为自动纠错提供了依据。,82,2.6.2 海明校验码(续),编码 一个字节由8位二进制位组成,故海明码的总位数为13位,可表示为:H13 H12H2 H1 五个校验位P5P1对应的海明码位号应分别为:H13、H8、H4、H2、H1,除P5外,其余四位都满足Pi的位号等于2i-1的关系,而P5只能放在H13上,因为它已经是海明码的最高位了。P5 D8 D7 D6 D5 P4 D4 D3 D2 P3 D1 P2 P1,83,2.6.2 海明校验码(续),校验 将接收到的海明码进行偶校验,校验得到的结果值S5S1(指误字)能反映13位海明码的出错情况:当S5S1为00000时,表明无错。当S5
37、S1中仅有一位不为0,表明是某一校验位出错或三位海明码(包括信息位和校验位)同时出错。由于后一种出错的可能性很小,故认为是前一种错,出错位是该Si对应的Pi位。,84,2.6.2 海明校验码(续),当S5S1中有两位不为0,表明是两位海明码同时出错,此时只能发现错误,而无法确定出错的位置。当S5S1中有三位不为0,表明是一位信息位出错或三位校验位同时出错。出错位的位号由S4S1四位代码值指明,此时不仅能检查出一位错,而且能准确地定位,因此可以纠正这个错误(将该位变反)。当S5S1中有四位或五位不为0时,表明出错情况严重,系统工作可能出现故障,应检查系统硬件的正确性。,85,2.6.3 循环冗余
38、校验码,在计算机网络、同步通信以及磁表面存储器中广泛使用循环冗余校验码,简称CRC码。循环冗余校验码是通过除法运算来建立有效信息位和校验位之间的约定关系的。假设,待编码的有效信息以多项式M(X)表示,将它左移若干位后,用另一个约定的多项式G(X)去除,所产生的余数R(X)就是检验位。有效信息和检验位相拼接就构成了CRC码。当整个CRC码被接收后,仍用约定的多项式G(X)去除,若余数为0表明该代码是正确的;若余数不为0表明某一位出错,再进一步由余数值确定出错的位置,以便进行纠正。,86,1.循环冗余校验码的编码方法,循环冗余校验码是由两部分组成的,左边为信息位,右边为校验位。若信息位为N位,校验
39、位为K位,则该校验码被称为(N+K,N)码。图2-13 循环冗余校验码的格式,87,1.循环冗余校验码的编码方法(续),循环冗余校验码编码规律 把待编码的N位有效信息表示为多项式M(X)。把M(X)左移K位,得到M(X)XK,这样空出了K位,以便拼装K位余数(即校验位)。选取一个K+1位的产生多项式G(X),对M(X)XK作模2除。=Q(X)+把左移K位以后的有效信息与余数R(X)作模2加减,拼接为CRC码,此时的CRC码共有N+K位。,88,2.循环冗余校验码的校验与纠错,把接收到的CRC码用约定的生成多项式G(X)去除,如果正确,则余数为0;如果某一位出错,则余数不为0。不同的位数出错其余数不同,余数和出错位序号之间有唯一的对应关系。,89,3.生成多项式的选择,生成多项式被用来生成CRC码,并不是任何一个K+1位多项式都可以作生成多项式用的,它应满足下列要求:任何一位发生错误都应使余数不为0。不同位发生错误应当使余数不同。对余数作模2除法,应使余数循环。在计算机和通信系统中广泛使用下述两个生成多项式,它们是:G(X)=X16+X15+X2+1 G(X)=X16+X12+X6+1,
链接地址:https://www.31ppt.com/p-5985973.html