计算机组成原理-中央处理机组织.ppt
《计算机组成原理-中央处理机组织.ppt》由会员分享,可在线阅读,更多相关《计算机组成原理-中央处理机组织.ppt(116页珍藏版)》请在三一办公上搜索。
1、,本章学习导读:(1)中央控制器(CPU)的结构、功能、时序控制方式及指令执行过程。(2)CPU的3种实现方式:组合逻辑、PLA和微程序控制。(3)为提高计算机系统性能,CPU逻辑结构的若干新技术:VLIW、EPIC、多核多线性等。,第6章 中央处理机组织,主流硬件,1,主板:一线品牌:华硕P5E,微星P35,技嘉P35C 其他品牌:昂达A78GT,捷波悍马HAO4,斯巴达 克黑潮BI-100,映泰TA780G2,CPU:INTEL四核,双核:酷睿 Core2 Quad Q6600,Core2 Duo E8200,奔腾 Pentium E2160 AMD四核,双核:羿龙9500,速龙64X2,
2、Athlon,在IntelCPU名称中,Core 2产品表示采用的是酷睿2核心,Duo 表示双核设计,Quad表示四核设计。Core2 Duo E8200主频2.66GHZ 外频333MHZ 倍频为8X一级数据缓存32KB 共享6MB二级缓存由4.1亿个晶体管组成。Cor2 Quad Q6600主频2.4GHZ 外频266MHZ 倍频为9X高速缓存8MB,Centrino迅驰移动计算技术,它是英特尔于2003年3月12日,面向笔记本电脑推出的无线移动计算技术的品牌名称。迅驰(Centrino)是:Centre(中心)与Neutrino(中微子)两个单词的缩写。它由三部分组成:移动式处理器(CP
3、U)、相关芯片组以及无线网络功能模块。迅驰品牌,是英特尔首次将一系列技术用一个名字来命名。英特尔“迅驰”移动计算技术是新一代笔记本电脑使用的创新技术。Intel Pentium M处理器 Intel 855系列芯片组 Intel 802.11 PRO/无线网络连接,优雅HP570神舟笔记本(迅驰),英特尔45nm core2 双核2.0G处理器P7350英特尔GM45+ICH9M芯片组集成Intel GMA X4500HD 显卡14.1高亮宽屏2G DDR-2 内存250G SATA 硬盘DVDRW刻录光驱内置200W像素摄像头/阵列式麦克风内置intel5100AN无线网卡6芯锂电池 399
4、8元(09年暑假),1是整合音效芯片,2是I/O控制芯片,3是光驱音源插座,4是外接音源辅助插座,5是SPDIF插座,6是USB插头,7是机箱被开启接头,8是PCI插槽,9是AGP4X插槽,10是机箱前端通用USB接口,11是BIOS,12是机箱面板接头,13是南桥芯片,14是IDE1插口,15是IDE2插口,16是电源指示灯接头,17是清除CMOS记忆跳线,18是风扇电源插座,19是电池,20是软驱插座,21是ATX电源插座,22是内存插槽,23是风扇电源插座,24是北桥芯片,25是CPU风扇支架,26是CPU插座,27是12VATX电源插座,28是第二组音源插座,29是PS/2键盘及鼠标插
5、座,30是USB插座,31是并串口,32是游戏控制器及音源插座,33是SUP_CEN插座。,CPU概念:控制并执行指令的部件,该部件不仅要与计算机的其它功能部件进行信息交换,还要控制它们的操作。CPU基本功能:读取并执行指令,它通常包括控制器与运算器两大部分。,6.1 CPU的结构与功能,6.1.1 CPU的组成与操作,CPU的组成(图6.1),CPU中的寄存器可分为通用寄存器和专用寄存器两大类:通用寄存器(R0,R1,;AX,BX,)专用寄存器专用寄存器是专门用来完成某一种特殊功能的寄存器。CPU中至少要有5个专用的寄存器。它们是:程序计数器(PC)、指令寄存器(IR)、存储器地址寄存器(M
6、AR)、存储器数据寄存器(MDR)、状态标志寄存器(PSWR)。,CPU的主要寄存器,(1)程序计数器(PC)Program Counter又称指令计数器,用来存放接着要执行的下条指令所在主存单元的地址。对于顺序执行的情况,PC的内容应不断地加“1”,以控制指令的顺序执行。这种加“1”的功能,有些机器是程序计数器本身具有的,也有些机器是借助运算器来实现的。(2)指令寄存器(IR)Instruction Register用来存放从存储器中取出的指令。当指令从主存取出并暂存于指令寄存器之后,在执行指令的过程中,指令寄存器的内容不允许发生变化,以保证实现指令的全部功能。,(3)存储器数据寄存器(MD
7、R)Memory Data Register来暂时存放由主存储器读出的一条指令或一个数据字;反之,当向主存存入一条指令或一个数据字时,也暂时将它们存放在存储器数据寄存器中。(4)存储器地址寄存器(MAR)Memory Address Memory用来保存当前CPU所访问的主存单元的地址。由于主存和CPU之间存在着操作速度上的差别,所以必须使用地址寄存器来保持地址信息,直到主存的读写操作完成为止。,(5)状态标志寄存器(PSWR)Program Status Word Register主要包括两部分内容:一是状态标志,如进位标志(C)、结果为零标志(Z),大多数指令的执行将会影响到这些标志位;二
8、是控制标志,如中断标志、陷阱标志等。例如:8086微处理器的状态标志寄存器有16位,如图6-1所示,一共包括9个标志位,其中6个为状态标志,3个为控制标志。,6个状态标志为:进位标志位(CF),Carry Flag 表示本次操作是否向高位有进位(借位),通常用于无符号数;辅助进位标志位(AF),Auxiliary Flag 表示第3号位是否向第4号位有进位(借位);溢出标志位(OF),Overflow Flag 表示本次运算结果是否溢出,通常用于带符号数;零标志位(ZF),Zero Flag 表示本次运算结果是否为零;符号标志位(SF),Sign Flag 表示本次运算结果的符号(正负);校验
9、标志位(PF),Parity Flag 表示数据校验位是0或1。,3个控制标志为:方向标志(DF),Direction Flag表示串操作指令中字符串操作的方向;中断允许标志位(IF),Interrupt Flag表示CPU是否能够响应外部的可屏蔽中断请求;陷阱标志位(TF),Trap Flag为了方便程序的调试,使处理器的执行进入单步方式而设置的控制标志位。,CPU(CU+ALU)至少应有以下四种基本功能:,读取某一主存单元的内容,并将其装入某一个CPU寄存器;把一个数据字从某一CPU寄存器存入某个给定的主存单元中;,1从内存读取一个字(1)MARR1(2)Read(3)WMFC;等待MFC
10、信号(Wait for Memory Function Complete)(4)R2MDR,把一个数据字从某一CPU寄存器送到另一个寄存器或者ALU;进行一个算术运算或逻辑运算,将结果送入某一CPU寄存器。,2把一个字写入主存(1)MARR1(2)MDRR2(3)Write(4)WMFC,3通用寄存器之间传送数据 R1out,R4in,4完成算术、逻辑运算(1)R1out,Yin(2)R2out,Add,Zin(3)Zout,R3in,6.1.2 控制器的控制方式,1.同步控制方式(集中控制方式):对机器的所有指令采用统一的时序信号.用相同数目的机器周期,相同数目的节拍脉冲来形成每条指令的控制
11、操作序列.特点:时序关系简单,但以牺牲速度为代价.2.异步控制方式(分散控制方式):每条指令、每个微操作需要多少时间就占用多少时间,不采用统一的周期和节拍,时间上的衔接通过应答通讯方式(握手方式)实现.特点:无时间浪费,但时序控制比较复杂.3.联合控制方式:同步控制与异步控制相结合.,同步控制方式:对机器的所有指令采用统一的时序信号。特点:a)以微操作序列最长的指令为标准,确定控制微操作运行的节拍数b)控制器产生统一的,顺序固定的,周而复始的节拍脉冲c)微操作序列短的指令可空着一部分不用优点:电路简单缺点:运行速度慢,异步控制方式:采用“结束起始”的工作方式,无统一的时序信号。特点:a)每条指
12、令按实际需要产生节拍数b)指令执行完毕,发出“结束”信号c)控制器收到“结束”信号,开始执行下条指令优点:运行速度快缺点:控制电路比较复杂,联合控制方式:将同步控制方式与异步控制方式结合使用。特点:a)大部分指令按同步控制执行中央控制b)小部分特殊指令(过长、过短),采用异步控制方式执行局部控制优点:能保证一定的运行速度缺点:电路设计相对复杂,6.1.3 CPU控制流程,计算机进行信息处理的过程就是不断地取指令、分析指令和执行指令这样一个周而复始的过程。,图6.5给出了CPU控制流程 对异常情况和某些请求通 过中断处理。,控制器的组成,6.1.5 一条完整指令的执行,考虑一条比较简单的指令:A
13、dd(R3),R1,执行这条指令需要下列动作(图6.7):(1)取指令;(2)取第一个操作数(由R3所指出的存储单元的内容);(3)完成加法运算;(4)结果存入R1中。,步 动作 说明 1 PCout,MARin,Read,Clear Y,1=C0,Add,Zin;取指,(PC)+1 2 Zout,PCin,WMFC;(PC)+1=PC 3 MDRout,IRin;指令=IR 4 R3out,MARin,Read;取数据 5 R1out,Yin,WMFC;(R1)=Y 6 MDRout,Add,Zin;相加 7 Zout,R1in,End;结果=R1 图6.7 指令Add(R3),R1的执行控
14、制序列,步 动作1 PCout,MARin,Read,Clear Y,1=C0,Add,Zin2 Zout,PCin,WMFC3 MDRout,IRin4 PCout,Yin5(IR的偏移字段)out,Add,Zin6 Zout,PCin,End 图6.8 无条件转移指令的控制序列,条件转移的情况 图6.8中第4步应改为:If N=0 then End If N=1 then PCout,Yin,6.1.6 CPU性能设计,决定CPU性能最重要的三个因素:指令的功能强弱、时钟周期的长短、执行每条指令所需时钟周期数。,指令流水执行过程中,采用相对简单的指令会更合适;时钟速度取决于所采用的电子电路
15、的速度和功能部件(如ALU)的实现技术;在过去的二十年间,微处理器芯片的时钟频率从几兆已经发展到几百兆、几千兆。,1.多总线组织 为了达到更高的性能,每条指令的执行时钟周期尽量少,最理想的是一个时钟周期;单总线只允许在一个时钟周期内传输一个数据;有必要考虑在CPU内部采用多总线结构。如Pentium处理器就采用了分层次多总线结构。,多总线结构的实现 所有通用寄存器都被放入一个被称为寄存器堆(register file)的单独模块中。在VLSI技术中,实现这些寄存器最有效的方法是采用存储元件阵列。图6.9 CPU三总线组织,考虑以下三操作数指令的例子:OP Rsrc1,Rsrc2,Rdst,2.
16、指令流水 指令流水(instruction pipelining)技术:CPU能够将指令的取指周期和执行周期重叠起来,会极大地改善CPU性能。,一条指令流水线可由如下5段组成:(图6.10)S1,取指令(IF):由cache或主存取指令;S2,指令译码(ID):生成指令将要完成的操作;S3,取操作数(OF):确定存储器操作数地址,读取 存储器操作数和寄存器操作数;S4,执行(EX):对操作数完成指定操作;S5,写回(WB):修改目标操作数。,后一指令的第i功能步与前一指令的第i+1功能步同时进行。,上图中,完成4条指令的执行只用了8个时钟周期;若是非流水线的顺序处理则需要20个时钟周期。,就一
17、条指令而言,执行速度并没有加快。但流水线技术是通过硬件并行工作,加快指令执行速度的技术。流水线对机器性能的改善程度取决于能把处理过程分解成相等时间步数的多少。流水线处理技术是在重叠控制基础上发展起来的。它将一个复杂过程分解成多个子过程,每个过程段都具有专用的功能部件,因而可以使所有子过程同时对不同数据进行处理。流水线技术特点为:一个流水过程,可以包括多个子过程,每个子过程都有专门的功能段来完成;各功能段所需的时间是相同的。适合于大量的重复性处理。,3.指令发射与完成策略 指令发射(instruction issue)是指启动指令进入执行的过程;指令发射策略是指发射所使用的协议或规则;指令的发射
18、和完成策略主要用于流水线的调度,对于充分利用指令级的并行度,提高处理器性能十分重要。,当指令按程序的指令次序发射时,称之为按序发射(in-order issue);为改善流水线性能,可以将有(结构、控制、数据)冒险的指令推后发射,而将后面的无冒险的指令提前发射,即不按程序原次序发射指令,称之为乱序发射或无序发射(out-of-order issue)。,有三种指令发射与完成策略:按序发射按序完成;按序发射无序完成;无序发射无序完成。,Pentium处理器采用的是按序发射按序完成策略;Pentium/处理器采用的是按序发射无序完成策略,而以按序回收来保证程序最终结果的正确性。,无论采用哪种策略对
19、流水线进行调度,都要保证程序运行最终结果的正确性。,4.动态执行技术 动态执行(dynamic execution)技术是通过预测程序流来调整指令的执行,并且分析程序的数据流来选择指令执行的最佳顺序。,动态执行技术由以下3方面组成:利用转移预测技术(通常预测正确率高达90%):允许程序的几个分支流同时在处理器中进行;,数据流分析(dataflow analysis):通过分析指令之间的数据相关性,产生优化的重排序的指令调度;,推测执行(speculative execution):将多个程序流向的指令序列,以调度好的优化顺序送往处理器的执行部件去执行,尽量保持多端口多功能的执行部件始终为“忙”
20、,以充分发挥此部件的效能。,5.一个完整的CPU(图6.11),CPU、微处理器,其工作主要还是进行标量处理取指令、编译和执行指令;采用多功能部件和流水线技术,可以在一个时钟周期内完成多条指令的取指和执行。这种处理器被称为超标量流水线处理器(superscalar pipelining processor)。超标量技术是指在每个时钟周期内同时并发多条独立指令,即两条或两条以上指令并行编译、执行。超流水线技术是将一些流水线寄存器插入到流水线段中,对流水管道再分,使每段的长度近似相等,以便现有的硬件在每个周期内使用多次,即每个超流水线段都以数倍于基本时钟频率的速度工作。,6.1.7 典型CPU举例
21、,1Pentium处理器 Pentium是Intel公司x86系列的第五代微处理器;主要寄存器为32位宽,是一个32位微处理器;连接存储器的外部数据总线宽度为64位,每次可同时传输8个字节;Pentium外部地址总线宽度是36位,一般使用32位,故物理地址空间为4GB。,Pentium采用U,V两条指令流水线的超标量结构,内部有分立的8KB指令cache和8KB数据cache,外部还可接256512KB的二级cache;,大多数简单指令是用硬连接技术实现,一个时钟周期执行完;Pentium的CISC特征是主要的,属于CISC结构处理器。,Pentium有四类寄存器组:,基本结构寄存器组 通用寄
22、存器 段寄存器 指令指针 标志寄存器,系统级寄存器组 系统地址寄存器 控制寄存器,浮点部件寄存器组 数据寄存器堆 控制寄存器 状态寄存器 标记字 事故寄存器,调试和测试寄存器组,图6.12 Pentium CPU结构框图,Pentium有4个方面的新型体系结构特点:(图6.12),(1)超标量流水线 超标量流水线是Pentium系统结构的核心。由U,V两条指令流水线构成,每条流水线都有自己的ALU、地址生成电路和与数据cache的接口。,(2)分设的指令cache和数据cache Pentium内有分立的8KB指令cache和8KB数据cache;指令cache向指令预取缓冲器提供指令代码;数
23、据cache与U、V流水线交换数据;它们对Pentium的超标量结构提供了强有力的支持。,(3)先进的浮点运算部件 Pentium的浮点运算采用8段流水线,前4段在U、V流水线中完成,后4段在浮点运算部件中完成。,(4)以BTB(branch target buffer)实现的动态转移预测(分支目标缓冲器)。Pentium采用动态转移预测技术,来减少由于过程相关性引起的流水线性能损失。,Pentium的后续产品Pentium MMX、Pentium Pro、Pentium II、Pentium III更是集成了MMX技术,增强了音频、视频和图形等多媒体应用的处理能力,加速了数据加密和数据压缩与
24、解压的过程;具有包括数据流分析、转移预测和推测执行在内的动态执行技术能力;采用双重独立的总线结构和SEC(Single Edge Contact)单边接触封装技术。Pentium III首次采用了Intel公司自行开发的流式单指令多数据扩展SSE(Streaming SIMD Extensicm);,SSE技术使得Pentium III处理器在三维图像处理、语言识别、视频实时压缩等方面都有很大进步,而在互联网应用中最能体现这些进步;,多处理器技术、虚拟分页扩展技术、单指令多数据流(SIMD)技术等融入处理器芯片,使PC的系统结构朝着更便于处理多媒体和互联网络的信息方向发展。,Pentium I
25、I/III处理器采用了层次化的两级(L1和L2)cache技术;L1cache是指令与数据分立的哈佛结构,采用写无效式的MESI监听协议;,Pentium II/III已将CISC的指令在处理器内部翻译成一组RISC的微操作来执行,并实现了超标量、超级流水(14段)的指令流水线。,6.2 组合逻辑控制与PLA控制,控制器的核心部件“操作控制信号形成部件”产生指令所需要的操作控制信号序列,用以控制计算机各部分的操作,它是整个控制器的核心,也是最复杂的部件。,该部件的组成可用微程序方式,也可用组合逻辑方式或PLA方式,即通过逻辑电路直接产生控制信号(又称硬布线方式)。,6.2.1 组合逻辑控制,产
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 组成 原理 中央 处理机 组织

链接地址:https://www.31ppt.com/p-6023922.html