信息的编码存储与管理课件.ppt
《信息的编码存储与管理课件.ppt》由会员分享,可在线阅读,更多相关《信息的编码存储与管理课件.ppt(81页珍藏版)》请在三一办公上搜索。
1、2023/3/23,北京大学,1,注意事项,注意事项助教分配已完成,注意看课程网站;Email,电话发给助教;上交作业的格式:标题、学号、姓名;,2023/3/23,北京大学,2,内容回顾,前讲问题计算机是什么?冯诺依曼体系结构是怎样?操作系统的基本功能是什么?,第三讲 信息的编码、存储与管理,北京大学 信息科学技术学院,2023年3月23日,2023/3/23,北京大学,4,本讲内容,数制转换及二进制运算数制及数制转换、二进制数的运算数字化原理声音、图像、视频等信息的编码信息的输入与输出键盘/鼠标输入、显示打印输出等等信息存储的原理及设备存储介质、存储器及其工作原理信息的管理文件系统、数据库
2、,数制转换及二进制运算,2023/3/23,北京大学,6,数制及数制转换,数制也称计数制,是指用一组固定的符号和统一的规则来表示数值的方法。按进位的方法进行计数,称为进位计数制。计算机系统中几种常用进位计数制:十位制(Decimal notation)二进制(Binary notation)八进制(Octal notation)十六进制数(Hexdecimal notation),计算能力等价,2023/3/23,北京大学,7,数制及数制转换,十进制数的特点是用十个数码(09)表示所有的数,基数是10,采用逢十进一的记数方法。二进制数的特点是用两个数码(01)表示所有的数,基数是2,采用逢二进
3、一的记数方法,八进制数的特点是用八个数码(07)表示所有的数,基数是8,采用逢八进一的记数方法。十六进制数的特点是用十六个数码(0F)表示所有的数,基数是16,采用逢十六进一的记数方法。,2023/3/23,北京大学,8,数制及数制转换,2023/3/23,北京大学,9,例:十进制数253在不同数制下的表示253=2102+5101+3100=An2n+A(n-1)2(n-1)+A121+A020=Bm8m+B(m-1)8(m-1)+B181+B080=Ck16k+C(k-1)16(k-1)+C1 161+C0 160AnA(n-1)A1A0:二进制数BmB(m-1)B1B0:十进制数CkC(
4、k-1)C1C0:十六进制数,数制及数制转换,2023/3/23,北京大学,10,不同数制之间的转换,实质是基数间的转换。一般转换的原则是:如果两个有理数相等,则两数的整数部分和小数部分一定分别相等。因此,各数制之间进行转换时,通常对整数部分和小数部分分别进行转换。,数制及数制转换,2023/3/23,北京大学,11,整数的转换,数制及数制转换,十进制数转换成二进制数 把十进制数转换为二进制数的方法是:整数转换用“除2取余法”;小数转换用“乘2取整法”。,11111101,2023/3/23,北京大学,12,十进制数转换成二进制数 将(0.745)10转换成四位二进制小数,转换过程如下:0.7
5、452 1.490 取出整数10.4902 0.980 取出整数00.9802 1.960 取出整数10.9602 1.920 取出整数10.920 转换结束 这里,第四次乘积的小数部分不为0,但已满足题目所要求的精度,所以,(0.745)10(0.1011)2。显然,在转换过程中,做的乘法次数越多,结果就越精确。,小数的转换,数制及数制转换,2023/3/23,北京大学,13,十进制数转换成八进制数和十六进制数 十进制数转换成八进制数的方法是:整数部分转换采用“除8取余法”;小数部分转换采用“乘8取整法”。十进制数转换成十六进制数的方法是:整数部分转换采用“除16取余法”;小数部分转换采用“
6、乘16取整法”。,数制及数制转换,2023/3/23,北京大学,14,二进制与八进制及十六进制之间的转换,数制及数制转换,2023/3/23,北京大学,15,非十进制数转换成十进制数 非十进制数转换成十进制数的方法是,把各个非十进制数按权展开求和即可。即把二进制数(或八进制数,或十六进制数)写成2(或8或者16)的各次幂之和的形式,然后计算其结果。11111101.1011=127+126+125+124+123+122+021+120+12-1+02-2+12-3+12-4=253.6875(375)8=382+781+580=253(FD)16=D161+F160=253,.745精度原因
7、,数制及数制转换,2023/3/23,北京大学,16,数制及数制转换,问题:任意2个数制之间的转换方法?如15进制数转换为12进制,该如何进行?,2023/3/23,北京大学,17,二进制数的运算,在计算机内部,最基本的数制表示是二进制。其运算包括:算术运算:加、减、乘、除逻辑运算:与、或、非、异或,2023/3/23,北京大学,18,二进制数的算术运算,加法,减法,二进制数的运算,2023/3/23,北京大学,19,二进制数的算术运算,乘法,除法,二进制数的运算,(10001111)2,(6)10,(38)10,(6)10,(2)10,2023/3/23,北京大学,20,二进制数的逻辑运算:
8、没有进位,按位运算,逻辑非 单操作数运算:1 0;0 1逻辑或|双操作数运算:0|0=0;0|1=1 1|0=1;1|1=1逻辑与&双操作数运算:0&0=0;0&1=0 1&0=0;1&1=1逻辑异或 双操作数运算:0 0=0;0 1=1 1 0=1;1 1=0,!11010=00101,11001|01101 11101,11001&01101 01001,11001 01101 10100,二进制数的运算,数字化原理,2023/3/23,北京大学,22,“冯.偌依曼体系结构”的基本思路:由运算器、存储器、控制器、I/O设备五大部分组成。程序与数据预先存入主存,工作时连续自动高速顺序执行。即
9、“存储程序”思想。采用二进制形式表示数据和指令。虽然现实生活中的数据其表现形式多种多样,但在现在的计算机内部,一律采用二进制表示数据和指令。,数字化原理,常见的数据类型,计算机内的数据,计算机内的数据采用统一的数据表示法位(bit):存储在计算机中的最小数据单位,0 或1位模式:表示数据的位序列,或位流字节(byte):长度为8的位模式称为字节,2023/3/23,北京大学,25,指令编码 数值表示 字符编码声音编码 图像编码 影像编码 基本编码规则,数字化原理,2023/3/23,北京大学,26,将计算机内部所能进行的各种基本操作用二进制数表示出来,以便于计算机的识别于运行。如:加法 000
10、00001 减法 00000010 乘法 00000011 除法 00000100 跳转 00000101 则:1+3 可以表示为 00000001 00000001 000000112*4 可以表示为 00000010 00000011 00000100,每条指令,都用固定长度的二进制数表示,数字化原理指令的编码,2023/3/23,北京大学,27,在计算机内部,由于要运算等因素,并不是直接以原始的二进制数本身来存储的,而是要经过一定的编码,包括:原码、反码和补码。有关这三种码的含义及其所表示的数据的方式(整数和浮点数),有兴趣的同学可以在课后阅读有关文献。此外,计算机内用来表示数据的二进制
11、位数也不是无限的,往往用固定位数来表示数据,因此,其表达的数据范围是有限的(在“程序设计”中会涉及):8位:0255(28-1)字节 16位:065535(216-1)32位:040亿(232-1)64位:天文数字(264),数字化原理数值的表示,2023/3/23,北京大学,28,字符的编码 ASCII码是美国国家标准信息交换码(American National Standard Code for Information Interchange)的简称,是目前国际上使用最广泛的字符编码。ASCII码的编码规则为:每个字符用7位二进制数(d6d5d4d3d2d1d0)来表示,7位二进制共有1
12、28种状态(27=128),可表示128个字符,7位编码的取值范围为00000001111111。在计算机内,每个字符的ASCII码用1个字节(8位)来存放,字节的最高位(d7)为校验位,通常用“0”来填充,后7位(d6d5d4d3d2d1d0)为编码值。7位编码的ASCII码字符集包括了128个字符,称为标准的ASCII码字符集。,字符编码:ASCII码,2023/3/23,北京大学,29,ASCII码,字符编码:ASCII码,A:01000001,2023/3/23,北京大学,30,1、常用汉字有30005000个,无法用一个字节编码。2、我国公布的通用汉字字符集(基本集)及其交换码标准G
13、B2312-80共收集了7445个字符,用两个字节编码表示一个字符,每个字节最高位为0。GB2312-80编码简称国标码。3、汉字内码是汉字在计算机内部存储、处理和传输用的信息编码。它必须与ASCII码兼容但又不能冲突。内码是把国标码两个字节的最高位置“1”得到的。,字符编码:汉字编码,2023/3/23,北京大学,31,声音是随时间变化的声波波形。与颜色类似,对声音波形需要进行离散化采样。声波的离散化采样是在两个维度上独立进行的。从时间维上进行时间的离散化(按一定的均匀时间间隔采样),同时,每一个采样点的高度值(声音波形的振幅)也是经过离散化,纪录为n个bit的整数编码。两者合在一起表示了声
14、音波形的编码文件。这种记录声音的方式称为声音的波形编码。,声音的编码,2023/3/23,北京大学,32,采样点的时间间隔越小,就与原始波形函数越符合。声音编码中的“采样频率”,指得就是单位时间对声音波形的采样次数。采样频率用Hz(赫兹)为单位,每秒钟采样500次即为500Hz。显然,采样频率高的声音记录质量会更好一些,为此所用的存储空间也大一些。音乐CD的采样频率为44.1KHz。为了存储一首4分钟长的歌曲,假定它是双声道,每声道2字节的采样值,一次采样需要占用32bit。这样每1秒钟的音乐就需要441004160K字节,总计需要460160K36MB。需要的存储容量是非常大的。,声音的编码
15、,2023/3/23,北京大学,33,以颜色码为基础,将原始连续信息离散化为网格点,记录每个网格点的颜色值。,2色,分辨率,图像的编码:点阵表示,2023/3/23,北京大学,34,图像的编码:点阵表示,2023/3/23,北京大学,35,数字化电影(影像)主要是由时间上连续序列的数字化图片再加上数字化声音的合成体。影像是在时间和空间上对活动场景的离散采样。影像中的一张图片是对某一时刻场景的空间离散采样,称为影像的一帧。每秒约25帧的连续帧采样就形成影像,这是和人眼的视觉效果有关。通常一秒钟需要采样24帧左右,才能在视觉上感知为连续影像。当每秒钟采集的影像帧再减少,视觉上会有断续感,效果变差。
16、如果多于30帧/秒,视觉基本上没有区别了,因为人眼的分辩能力有限。影像所需要的存储空间非常大。存储10分钟的640480的真彩色连续影像,按照每秒钟25帧计算,不包括声音信息,需要(6404803 byte25帧10分钟60秒)个字节,大约14GB(13824M)字节。与影像相比,动画通常是将矢量图形作为每一帧来存储,数据量比之影像要小很多。,影像的编码,2023/3/23,北京大学,36,目标数据集合大小 C C 2k则最小K为编码位数(例)大写字母A,B,C,D,X,Y,Z共26个(32=25)大写字母集合 5 bit的编码集合(0000011001)映射规则:不多不少,一一对应映射的不变
17、量:序(大小)保持不变,数字化原理基本编码规则,二进制位数是关键!,2023/3/23,北京大学,37,编码的关键是:离散对象类 的集合分析键盘编码:分析 构成文字 的基本元素集大小写字母 集合大小 52数字和标点符号(可打印标点符号)集合 42A B C D E X Y Z a b c d e x y z,!“#$%?_|一共包括了 94 种不同的可打印符号,二进制编码需要 7 位。,数字化原理基本编码规则,信息的输入与输出,2023/3/23,北京大学,39,信息输入工作的实质就是把形式纷繁、丰富多彩的信息形式统统转化为计算机内部二进制数字形式。计算机系统信息处理的二值特性以及信息的编码方
18、式,决定了硬件的输入设备的基本原理。不同的输入设备,根据其输入信息的编码特点,利用其自身的物理电路特性,完成需采集信息的二进制编码采集,并通过缆线传输到计算机内部。,信息的输入,2023/3/23,北京大学,40,输入设备将采集的信息转换成二进制(根据信息的编码规则)信息以二进制形式输入计算机,信息的输入,2023/3/23,北京大学,41,输入设备产生信号 通过连接线路进入计算机 操作系统与输入设备驱动程序协作,接收输入信号 应用软件或操作系统本身对输入信号进行解释处理、编码 应用软件或操作系统将编码后的数据存储到存储设备中 必要的时候,应用软件或操作系统从存储设备中读取出来,进行解码,并通
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 编码 存储 管理 课件

链接地址:https://www.31ppt.com/p-3828476.html