计算机基础知识之数制、汉字编码课件.ppt
1.2 数制与编码,1.2.1 数据,计算机中的数据 数值数据和字符数据数值数据用以表示量的大小、正负,如整数、小数等。字符数据也叫非数值数据,用以表示一些符号、标记,如英文字母AZ、az,数字09,各种专用字符如:+、-、*、/、(、)及标点符号等。 汉字、图形、声音数据也属非数值数据。,各种进制数对照,你能继续说出之后的数吗?,区分不同的进制数,二进制数: 110110B 或 (110110)2八进制数: (21)O 或 (21)8十进制数: (304.72)D 或 (304.72)10十六进制数:(A3F)H 或 (A3F)16,如果没标注,则默认为十进制数,1.2.1 数制及相关概念,基数用R表示例如:十进制的基数R=10;二进制的基数R=2; 八进制的基数R=8;十六进制的基数R=16。位权位权用基数R的i次幂Ri表示。十进制数位权:个十百位分别是100、101、102 可类推 136.12=1102+3101+6100+110-1+210-2。 二进制数位权:相应是20、21、22 可类推 (10101.01)2=124+023+122+021+120+02-1+12-2 =(21.25)10,1.2.2 数制转换,其他进制数转换为十进制数按权展开:(A3F)H=AX162+3X161+FX160 =10X256+3X16+15X1 =(2623)D练习:11000000B=_D 110011B=_D,1.2.2数制转换,十进制数转换为其他进制数除R取余(R=2、8、16)182=_B,1.3 计算机中字符的编码,1.3.1 西文字符的编码,二进制的一位数称为位,英文用bit表示,一个位只能表示0和1两个状态由8个位构成1个字节,字节的英文用Byte表示,字节是计算机存储和运行的基本单位。一个英文字母占1字节(即1B) abcDEF;”_+!$# .一个汉字占2字节(2B) 中 人 引 不 (全角字母),1.3.1 西文字符的编码,通常,二进制数的最高位是符号位,0为正,1为负ASCII码被国际标准化组织(ISO)指定为国际标准,在世界上通用。8位的ASCII码用一个字节的低7位进行编码,最高位为0因此共有128个不同的编码值,可以表示128个不同字符的编码,包括52个英文大小写字母、10个阿拉伯数字、32个标点符号和34个控制码。,你能说出ABCabc所对应的ASCII码值吗?(二进制、十进制),如果知道A对应1000001,十进制为65,则C对应的ASCII码的十进制数为多少?,1.3.2 汉字的编码,为了使计算机能够处理汉字,需要对汉字进行编码,根据计算机在处理汉字时的不同过程,汉字的编码一般分为输入码、机内码、字型输出码和交换码(国标码),以上的各种码对应于不同的处理过程。,区位码,1.3.2 汉字的编码,1输入码输入码是指在使用键盘输入汉字时对汉字的编码,也称为外码。汉字的输入码一般用键盘上的字母和数字来描述,通过键盘输入计算机。当前已经出现了许多不同特点的汉字输入码,主要有三类,形码、音码和音形码。 2机内码汉字机内码(简称内码)是计算机内部对汉字进行存储、处理、传输所使用的编码。当通过键盘输入汉字的的代码(输入码)后,计算机将该输入码转换成机内码,然后才进行其他处理。不同的计算机系统,其汉字的机内码也可能是不同的。,1.3.2 汉字的编码,3交换码汉字信息交换码是专门用于汉字信息交换的统一编码,用于汉字信息处理系统之间或者与通讯系统之间进行信息交换,简称交换码,或者国标码。1981年我国颁布了简体汉字编码的国家标准信息交换汉字编码字符集基本集,代号为“GB231280”,也称为国标码。 国标码=区位码(16进制)+(2020)H汉字内码=国标码+(8080)H,1.3.2 汉字的编码,4字形码汉字字形码是表示汉字字形的字模数据,通常用点阵、矢量函数等方式表示。字形码也称字模码,它是汉字的输出形式,随着汉字字形点阵和格式的不同,汉字字形码也不同。常用的字形点阵有1616点阵、2424点阵、4848点阵等。字模点阵的信息量是很大的,占用存储空间也很大,如果是NN点阵的字形码,那么每个汉字占用的字节数就是NN8。每种点阵计算中除以8,表示一个字节有8位。以1616点阵为例,每个汉字占用16168=32个字节,两级汉字大约占用256KB。,1.4 指令和程序设计语言,1.4.1 计算机指令,指令指令是让计算机完成某个操作发出的命令。一条指令对应于一种基本操作,通常一个复杂的操作可以分解成无数单个不同指令的集合,计算机所能执行的全部指令,就是计算机的指令系统。指令的基本格式:操作码|操作数操作码:表示指令的操作性质,如加、减。操作数:是操作过程中涉及的数据来源。例如ADD AX,BX。其中ADD就是操作码,AX,BX就表示了操作数,该指令表示把寄存器BX中的值和把寄存器AX中的值相加,把结果赋予把寄存器AX。,1.4.2 程序设计语言,机器语言指令系统也称为机器语言,也叫做二进制代码语言,它是由一串二进制数0、1构成的指令代码。机器语言是计算机硬件唯一能够识别的,不用翻译直接供机器使用的程序设计语言。不同机型的机器语言是不同的。与其他程序设计语言相比,其执行效率最高。用机器语言编写的程序我们叫机器语言程序,其可读性差、不易记忆,程序的调试和修改的难度也很大。另外,因为机器语言直接依赖于机器,所以在某种类型计算机上编写的机器语言程序不能在另一类计算机上使用。,1.4.2 程序设计语言,汇编语言其特点是用助记符代替操作码,用地址符号或标号代替地址码,这样用符号代替机器语言的二进制码,就把机器语言变成了汇编语言。例如用“ADD”表示加运算,用“AL”,“AH”表示某一寄存器等。用汇编语言编写的程序称为汇编语言源程序,汇编语言中由于使用了助记符号,计算机不能直接识别和执行它,用汇编语言编制的程序输入计算机,必须通过预先放入计算机的“汇编程序”的加工和翻译,才能变成能够被计算机识别和处理的二进制代码程序。运行时汇编程序要将源程序翻译成目标程序,称为汇编过程。,1.4.2 程序设计语言,高级语言高级语言是一种比较接近自然语言和数学表达式的计算机程序设计语言。用高级语言编写的程序称为“源程序”。把源程序翻译成机器指令,可采用编译和解释两种方式。编译方式产生可执行程序,解释方式不产生目标程序。高级语言容易学习,而且不依赖计算机的型号,通用性好,大大提高了编程的效率,改善了程序的可读性,便于推广和交流,是很理想的一种程序设计语言。,