三级偏软微机原理部分.ppt
,答疑时间:周五下午3:00-4:30第一部分答案阶六纠正,计算机微机原理,计算机的组成CPU存储器输入输出设备并行串行通信,1、计算机的组成,计算机是一个复杂系统,计算机硬件是计算机系统中所有实际物理装置的总称,计算机软件是指在计算机中运行的各种程序及其处理的数据和相关的文档,计算机硬件的逻辑结构 1,经典计算机的逻辑结构(冯.诺依曼计算机),(注:逻辑结构意指概念上(即功能上)的结构),计算机硬件的逻辑结构 2,现代计算机的逻辑结构,与经典计算机结构相比的3个变化:集中控制分散控制存储器内存储器外存储器通过CPU通信通过总线进行通信,台式PC的物理组成,台式机,2、CPU,什么是中央处理器(CPU)?,用于执行系统软件和应用软件的处理器称为CPU,CPU是计算机必不可少的核心组成部件多数个人计算机只有1个CPU,但有一些计算机包含有2个、4个、8个甚至成百上千个CPU将问题的解算步骤编制成为程序,程序连同它所处理的数据都用二进位表示并预先存放在存储器中程序运行时,CPU从内存中一条一条地取出指令和相应的数据,按指令操作码的规定,对数据进行运算处理,直到程序执行完毕为止,指令是什么?,指令就是命令,它用来规定CPU执行什么操作。指令是构成程序的基本单位,程序是由一连串指令组成的指令采用二进位表示,大多数情况下,指令由两个部分组成:,指出CPU应执行何种操作的一个命令词,例如加、减、乘、除、取数、存数等,指出该指令所操作(处理)的数据或者数据所在位置,举例:10 02 06,把02存储单元和06存储单元中的内容相加,和数保存在02单元,CPU的结构和任务,CPU主要由运算器、控制器和寄存器组3个部分组成CPU的任务:取指令并完成指令所规定的操作,存放待执行指令的地址,已经启动运行的程序和数据,存放待执行的指令并进行译码,完成规定的运算,暂存等待处理的数据,操作命令,8086微处理器内部结构,指令及其格式,指令采用二进位表示,大多数情况下由两个部分组成:,指出CPU应执行何种操作的一个命令词,例如加、减、乘、除等,指出该指令所操作(处理)的数据或者数据所在位置,指令的格式:操作码用几位表示?(多少种不同的操作功能)操作数地址是2个还是3个?R1R3+R5 R1R1-R3 如何指出内存地址?(寻址方式)指令长度是多少位,固定长度/可变长度?,影响CPU性能的主要因素(之一),CPU的字长(位数)是CPU中定点运算器的宽度目前PC使用的CPU大多是32位处理器,新一代的PC机将使用64位处理器主频(CPU时钟频率)指CPU中电子线路的工作频率主频提高,CPU的处理速度通常也会加快CPU总线(前端总线)的速度CPU总线速度决定了CPU与内存间数据传输速度的快慢高速缓存(cache)的容量与结构程序运行过程中高速缓存有利于减少CPU访问内存的次数cache容量越大、级数越多,其效用就越显著,影响CPU性能的主要因素(之二),CPU的指令系统指令的格式和功能会影响程序的执行速度CPU的逻辑结构CPU包含的定点运算器和浮点运算器数目是否流水线结构,流水线的条数和级数有无指令预测和数据预测功能是否具有数字信号处理功能是否多核,有几个内核,Pentium4的逻辑结构,寄存器组与CPU字长超标量结构ALU流水线处理技术SIMD技术EM-64T超线程技术双核与多核技术,Pentium 4 处理器的逻辑结构,指令译码器,整 数 寄 存 器 组,L1数据cache(8KB),浮 点 寄 存 器 组,慢ALU,复杂指令,2xALU,简单指令,2xALU,简单指令,2xAGU,存地址,浮点存浮 点 取,2xAGU,取地址,MMX,SSE/SSE2,浮点加浮点乘浮点除,执行跟踪cache(12000微操作),微码ROM,微操作队列,微操作队列,指令预取部件,动态分支预测器,前端总线,256位,时钟频率,64位,时钟频率,总线接口部件,总线接口,运算器,寄存器组,控制器,Pentium 4 处理器的芯片布局,Pentium 4的超标量结构运算器,采用超标量(superscalar)结构,一共包含9个ALU,均可同时工作:2个高速整数ALU(每个时钟周期进行2次操作),用于完成简单的整数运算(如加、减法)1个慢速整数ALU(需要多个时钟周期才能完成1次操作),用于完成整数乘、除法运算2个地址生成部件(AGU),用于计算操作数的有效地址,所生成的地址分别用于从内存取操作数或向内存保存操作结果1个ALU用于完成浮点操作数地址的计算1个ALU用于完成浮点加法、乘法和除法运算1个ALU用于执行流式的SIMD处理(SSE/SSE2/SSE3指令)1个ALU用于完成多媒体信号处理(MMX指令),I6,I5,I4,I3,指令的流水线执行,I2,指令的顺序执行:,I1,指令的流水线执行:,Pentium 4的流水线分成20级,每一级的操作都很简单,执行速度极快,因而允许时钟频率高达1GHz以上,超流水线(Hyper-pipeline)技术,Pentium 4有多条超流水线,每条流水线的级数均很长,定点运算达20级,浮点运算达到29级,处于执行状态的指令数最多可达到126条,超级流水线中每步操作都非常简单,因此主频可以显著提高,指令预取和分支预测,为了使流水线不中断,指令预取部件用于完成指令地址的计算,并从指令 cache中读取指令(一次64位),它还通过动态分支预测器对即将执行的指令提前进行预取,如果预测发生错误,那么流水线就会中断,CPU的速度将会受到影响,A=A+2;If(A10)B=A;,MMX/SSE/SSE2/SSE3指令,所谓SSE(扩展的单指令数据流)指令,其特点是1条指令可处理128位的数据,它可以是下列情况之一:4个单精度浮点数(各32位)2个双精度浮点数(各64位)16个8位整数8个16位整数4个32位整数2个64位整数1个128整数由于一条指令可以处理若干个整数或浮点数,因而大大提高了计算速度,这种做法称为单指令多数据技术(single-instruction,multiple-data,简称SIMD)SSE/SSE2/SSE3指令在完成3D图形、语音识别、图像处理等多媒体应用的时候非常有效,为什么需要64位计算?,原因:可以进行更大范围的整数运算可以支持更大的内存 进行64位计算的条件:64位的处理器64位的操作系统(如 Windows XP X64,Windows Vista)64位的应用软件 产品:RISC(UltraSparc、IBM公司的POWER5、HP公司的Alpha)Intel 安腾处理器(Itanium 和 Itanium 2)AMD64(Athlon 64系列、Athlon FX系列和Opteron系列)Intel EM-64T(Extended Memory 64 Technology)至强(Xeon)系列、Pentium 4 6xx系列 和 Pentium D系列、P4 至尊版,Pentium的64位扩展技术(EM-64T),整 数 寄 存 器 组,指令计数器标志寄存器,共16个64位寄存器,另外还增加8个128位的SSE寄存器 增加了处理64位整数的指令 支持c语言中的“long int”数据类型,对应的是64位整数,Pentium 4 的64位寄存器组,超线程(Hyper-Threading,HT)技术,背景:实际应用中CPU的执行单元没有被充分使用,性能未得到充分发挥超线程(HT)技术:把硬件模拟成两个处理器芯片,从OS来看就像有两个CPU一样,可同时执行2个线程P4处理器增加了一个逻辑CPU指针,而整数运算单元、浮点运算单元、L2 Cache等均由2个线程共享处理器有两种运行模式:Single Task Mode(单任务模式):系统只有1个逻辑处理器Multi Task Mode(多任务模式):系统有2个逻辑处理器分析:由于不是2个真正的CPU,它们需要共享ALU、cache等资源,当两个线程同时需要使用某个资源时,一个线程必须暂停运行,直到该资源空闲后才能继续执行。因此超线程的性能达不到2个物理CPU的性能超线程技术需要芯片组、OS和应用软件支持,才能发挥该项技术的优势,Windows2000就不支持双线程 当运行单线程应用软件时,超线程技术甚至会降低系统性能,双核处理器出现的背景,提高主频来提升处理器性能的瓶颈是散热问题:3.2GHz 的Pentium4处理器功率超过100W,内核温度达摄氏70度提升到4.0GHz时功率会达到150W,散热问题更难处理超线程技术虽然可以提高执行部件的使用效率,但有一定开销,对于单线程的软件反而降低了效率集成电路制造及封装技术的进步,有能力把2个甚至更多个处理器做在1个芯片内,双核处理器,1个芯片中有两个功能相同的处理器(内核),在操作系统看来,系统中有2个物理处理器 2个内核可以各有自己的L2 cache,但必须保正其中的信息完全一致,否则就会出现运算错误(由955X芯片组中北桥芯片负责),也可以共享同一个L2 cache用途:面向计算密集型应用和娱乐发烧友 产品:Pentium D(不支持超线程技术)Pentium Extreme Edition(至尊版)支持HT,最多可作为4个处理器用酷睿(Core Duo)双核处理器(嵌入式应用和笔记本):不支持HT和64位扩展酷睿2(Core 2 Duo)双核处理器:支持EM64T最新产品Core 2 quad(四核),揭开外壳后的Pentium D处理器,Pentium4提高速度的措施,扩展CPU的字长:64位存储扩展提高CPU的主频:已经从1.5GHz逐步提高到3GHz以上,目前最高已经接近4GHz;加快CPU前端总线的数据传输速度:CPU总线宽度增加为64128位CPU总线频率从400MHz、533 MHz提高到800MHz和1066MHz因此,传输速率也相应地从3.2GB/s、4.3GB/s提高到6.4GB/s和8.6GB/s采用cache存储器增大cache容量:L2 cache的容量从256KB也已经增大为1MB或2MB增加cache的级数:有些处理器采用L3 cache采用超标量运算器结构和超流水线技术提供和支持向量运算指令(SIMD指令)采用超线程技术,提高执行部件的工作效率采用双(多)核处理器技术,主板、芯片组与BIOS,(1)主板,主板的作用:安装所有的电子器件、电路与连接件主板安装内容:见上图ROM BIOS:存放最基础的软件基本输入/输出系统(BIOS)CMOS存储器:存放系统的基本参数(日期、时间、口令等),例:华硕P4T主板照片,(2)芯片组的作用,芯片组的作用:是PC机各组成部分相互连接和通信的枢纽北桥芯片:1.存储器控制功能;2.连接CPU、存储器、显卡、南桥芯片的枢纽南桥芯片:1.多种I/O设备的控制功能;2.I/O总线(PCI总线)功能;3.提供了各种I/O接口,关于芯片组的一些说明,芯片组与CPU芯片同步发展,有什么样功能和速度的CPU,就有什么样的芯片组与之配套 由于集成电路集成度越来越高,为降低系统成本,芯片组中集成了越来越多的功能,包括网卡、显卡、声卡等功能,(3)BIOS,什么是BIOS(Basic Input/Output System)?中文名为“基本输入/输出系统”,它是存放在主板上只读存储器(ROM)芯片中的一组机器语言程序功能:诊断计算机故障启动计算机工作控制基本的输入输出操作(键盘、鼠标、磁盘读写、屏幕显示等)BIOS 芯片保存BIOS的只读存储器(ROM)芯片,BIOS 芯片中包含的程序,加电自检程序(POST)(Power On Self Test)用于检测计算机硬件故障系统自举程序(Boot)启动计算机工作,加载并进入操作系统运行状态CMOS设置程序 设置系统参数:日期、时间、口令、配置参数等常用外部设备的驱动程序(Driver)实现对键盘、显示器、软驱和硬盘等常用外部设备输入输出操作的控制,PC机的启动工作过程,接通电源时CPU自动执行BIOS中的POST程序1.1 按CMOS中的内容来识别硬件的配置,测试各部件的工作状态(发现错误则报错)1.2 初始化CPU、内存、ROM、主板、CMOS、显示卡、键盘、软驱和硬盘等设备CPU自动执行自举程序 按照CMOS中预先设定的启动顺序,搜寻外存储器(软、硬盘或光盘)从外存储器读出引导程序,然后由引导程序读出操作系统并装入内存最后,将控制权交给操作系统,整个计算机由操作系统所控制,关于CMOS 芯片,这是一个容量很小的RAM存储器,由电池供电,即使计算机关机后也不会丢失所存储的信息作用:存放计算机硬件的参数(称为“配置信息”),包括日期和时间、口令、软盘/硬盘/光盘驱动器的数目、类型及参数、显卡类型、cache使用状况、启动机器时访问外存的顺序等,供BIOS程序使用设置和修改CMOS参数的方法:在开机启动BIOS工作时,按下Del键(或F2或F8健),即可进入BIOS中的CMOS设置程序,3、存储器,内存与外存的关系及比较,内存储器(简称内存或主存)存取速度快成本高、容量相对较小直接与CPU连接,CPU(指令)可以对内存中的指令及数据进行读、写操作属于挥发性存储器(volatile),用于临时存放正在运行的程序和数据,CPU,逐条执行指令,按指令要求完成对数据的运算和处理,外存储器(简称外存或辅存)存取速度慢成本低、容量很大不与CPU直接连接,计算机运行程序时,外存中的程序及相关数据必须先传送到内存,然后才能被CPU使用。属于不挥发性存储器(Nonvolatile),用于长久存放系统中几乎所有的信息,计算机中存储器的层次结构,分析:速度越快,成本较高。为了获得好的性能/价格比,计算机中各种存储器组成一个层状的塔式结构,取长补短,协调工作 工作过程:1)CPU运行时,需要的操作数大部分来自寄存器2)如需要从(向)存储器中取(存)数据时,先访问cache,如在,取自cache3)如操作数不在cache,则访问RAM,如在RAM中,则取自RAM4)如操作数不在RAM,则访问硬盘,操作数从硬盘中读出RAM cache,内存储器的分类及应用,内存由半导体存储器芯片组成,芯片有多种类型:,半导体存储器,只 读存储器(ROM),随机存取存储器(RAM),静态随机存取存储器SRAM,动态随机存取存储器DRAM,不可在线改写内容的ROM,快擦除存储器(Flash ROM),(用作Cache存储器),(用作主存储器),主存储器(RAM)的功能与原理,主存是CPU可直接访问的存储器,用于存放供CPU处理的指令和数据特点:以字节为单位进行连续编址,每个存储单元为1个字节(8个二进位)存储容量:主存储器中所包含的存储单元的总数(单位:MB或GB)存取时间:从CPU送出内存单元的地址码开始,到主存读出数据并送到CPU(或者是把CPU数据写入主存)所需要的时间(单位:ns,1 ns=10-9 s),存储器与CPU速度差距愈来愈大,DRAM,硬盘与CPU 之间的速度差距愈来愈大:,问题:由于CPU工作速度很快,内存速度比较慢(差12个数量级),从内存取数或向内存写数时,CPU往往需要等待,关于cache存储器,什么是cache(高速缓存)?,cache是一种小容量高速缓冲存储器,它由SRAM组成cache直接制作在CPU芯片内,速度几乎与CPU一样快程序运行时,CPU使用的一部分数据/指令会预先成批拷贝在cache中,cache的内容是主存储器中部分内容的映象当CPU需要从内存读(写)数据或指令时,先检查cache中有没有,若有,就直接从cache中读取,而不用访问主存储器,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,8,9,14,3,4,4,4,10,10,10,主存中的部分信息拷贝在cache存储器中,Cache存储器,主存储器,关于cache存储器,4、I/O控制与I/O接口,输入的任务:将输入设备输入的信息送到内存储器的指定区域 输出的任务:将内存储器指定区域的内容送出到输出设备 I/O操作也包括将外存储器的内容传输到内存,或将内存中的内容传输到外存储器,I/O操作的任务,I/O 操作的特点,I/O操作与CPU的运算可并行进行多个I/O设备可同时进行工作配置的I/O设备数量和品种可经常增减或变换每类I/O设备都有各自的控制器,它们按照CPU的I/O操作命令,独立地控制I/O操作的全过程,关于总线,总线的定义:用于在CPU、内存、外存和各种输入输出设备之间传输信息的一个共享的信息传输通路及其控制部件。总线的特点:1 共享;2 高速 总线的性能:数据通路宽度;总线工作频率;传输次数总线带宽(数据通路宽度/8)x 总线工作频率 x 传输次数总线的类型:CPU总线存储器总线I/O总线,关于I/O总线,I/O总线是各类I/O控制器与CPU、内存之间传输数据的一组公用信号线,这些信号线在物理上与主板扩展槽中插入的扩展卡(I/O控制器)直接连接。目前PC机使用的I/O总线PCI总线PCI-Express(高速PCI总线)I/O总线的带宽总线的数据传输速率(MB/s)=数据线位数/8总线工作频率(MHz)每个总线周期的传输次数,PCI总线扩展槽,关于I/O接口,I/O接口:I/O设备与I/O控制器之间的连接器包括:插头/插座的形式、通讯规程和电器特性等分类:从数据传输方式来分:串行(一次只传输1位)并行(多位一起进行传输)从是否能连接多个设备来分:总线式(可连接多个设备)独占式(只能连接1个设备)从是否符合标准来分:标准接口(通用接口)专用接口(专用接口),I/O设备接口,(安装在主板上的I/O设备接口),常用的I/O接口及其性能参数,关于USB接口,通用串行总线式接口(Universal Serial Bus)高速、可连接多个设备、串行传输传输速率:USB的1.1版:1.5 Mb/s和12 Mb/sUSB2.0版:高达480Mb/s(60MB/s)使用4线连接器,体积小,符合即插即用规范(Plug&Play,即PnP)使用“USB集线器”扩展机器的USB接口,最多连接127个设备可通过USB接口由主机向外设提供电源(5V,100500 mA)。,USB接口的3种类型,接口类型A,通常在PC上出现,接口类型B,通常在USB设备上出现,Mini-USB,数码相机、移动硬盘等设备经常使用,小结1:I/O总线,I/O控制器,I/O接口与I/O设备的关系,I/O设备通常都是物理上相互独立的设备,它们一般通过I/O接口与I/O控制器连接I/O控制器通过扩展卡或者南桥芯片与I/O总线连接I/O总线经过北桥芯片与内存、CPU连接,小结2:I/O总线,I/O控制器,I/O接口与I/O设备的关系,5、并行串行通信,