第6章中央处理器(终).ppt
《第6章中央处理器(终).ppt》由会员分享,可在线阅读,更多相关《第6章中央处理器(终).ppt(133页珍藏版)》请在三一办公上搜索。
1、1,蒋本珊 编著,中国计算机学会“21世纪大学本科计算机专业系列教材”计算机组成原理,2,第6章中央处理器,3,中央处理器(CPU)是整个计算机的核心,它包括运算器和控制器。本章着重讨论CPU的功能和组成,控制器的工作原理和实现方法,微程序控制原理,基本控制单元的设计以及先进的CPU系统设计技术。,4,本章学习内容,6.1中央处理器的功能和组成6.2 控制器的组成和实现方法6.3 时序系统与控制方式6.4 微程序控制原理6.5 控制单元的设计6.6 流水线技术6.7 精简指令系统计算机RISC,5,本章学习要求,理解:CPU的功能和主要寄存器理解:控制器的基本组成理解:时序系统中指令周期、机器
2、周期的概念了解:不同的控制方式(同步、异步、联合)理解:指令执行的基本过程掌握:取指周期的微操作序列(公共操作)理解:微程序控制的基本概念掌握:微指令编码法特点理解:微程序控制器的组成和工作过程理解:微程序入口地址和后继微地址的形成了解:控制单元的设计了解:流水线技术和RISC技术,6,6.1中央处理器的功能和组成,CPU对整个计算机系统的运行是极其重要的,这里将从CPU的功能、内部结构和主要技术参数入手,为后面详细讨论程序的执行过程打下基础。,7,6.1.1 CPU的功能,若用计算机来解决某个问题,首先要为这个问题编制解题程序,而程序又是指令的有序集合。按“存储程序”的概念,只要把程序装入主
3、存储器后,即可由计算机自动地完成取指令和执行指令的任务。在程序运行过程中,在计算机的各部件之间流动的指令和数据形成了指令流和数据流。,8,6.1.1 CPU的功能(续),需要注意的是,这里的指令流和数据流都是程序运行的动态概念,它不同于程序中静态的指令序列,也不同于存储器中数据的静态分配序列。指令流指的是CPU执行的指令序列,数据流指的是根据指令操作要求依次存取数据的序列。从程序运行的角度来看,CPU的基本功能就是对指令流和数据流在时间与空间上实施正确的控制。对于冯诺依曼结构的计算机而言,数据流是根据指令流的操作而形成的,也就是说数据流是由指令流来驱动的。,9,6.1.2 CPU中的主要寄存器
4、,1.通用寄存器 通用寄存器可用来存放原始数据和运算结果,有的还可以作为变址寄存器、计数器、地址指针等。现代计算机中为了减少访问存储器的次数,提高运算速度,往往在CPU中设置大量的通用寄存器,少则几个,多则几十个,甚至上百个。通用寄存器一般由程序编址访问。累加寄存器Acc也是一个通用寄存器,它用来暂时存放ALU运算的结果信息。例如,在执行一个加法运算前,先将一个操作数暂时存放在Acc中,再从主存中取出另一操作数,然后同Acc的内容相加,所得的结果送回Acc中。运算器中至少要有一个累加寄存器。,10,程序计数器(PC)程序计数器又称指令计数器,用来存放正在执行的指令地址或接着要执行的下条指令地址
5、。对于顺序执行的情况,PC的内容应不断地增量(加“1”),以控制指令的顺序执行。这种加“1”的功能,有些机器是程序计数器本身具有的,也有些机器是借助运算器来实现的。在遇到需要改变程序执行顺序的情况时,将转移的目标地址送往PC,即可实现程序的转移。有些情况下除改变PC的内容外,还需要保留改变之前的内容,以便返回时使用。,2.专用寄存器,11,指令寄存器(IR)指令寄存器用来存放从存储器中取出的指令。当指令从主存取出暂存于指令寄存器之后,在执行指令的过程中,指令寄存器的内容不允许发生变化,以保证实现指令的全部功能。存储器数据寄存器(MDR)存储器数据寄存器用来暂时存放由主存储器读出的一条指令或一个
6、数据字;反之,当向主存存入一条指令或一个数据字时,也暂时将它们存放在存储器数据寄存器中。,2.专用寄存器(续),12,存储器地址寄存器(MAR)存储器地址寄存器用来保存当前CPU所访问的主存单元的地址。由于主存和CPU之间存在着操作速度上的差别,所以必须使用地址寄存器来保持地址信息,直到主存的读写操作完成为止。当CPU和主存进行信息交换,无论是CPU向主存存取数据时,还是CPU从主存中读出指令时,都要使用存储器地址寄存器和数据寄存器。,2.专用寄存器(续),13,状态标志寄存器(PSWR)状态标志寄存器用来存放程序状态字(PSW)。程序状态字的各位表征程序和机器运行的状态,是参与控制程序执行的
7、重要依据之一。它主要包括两部分内容:一是状态标志,如进位标志(C)、结果为零标志(Z)等,大多数指令的执行将会影响到这些标志位;二是控制标志,如中断标志、陷阱标志等。状态标志寄存器的位数往往等于机器字长,各类机器的状态标志寄存器的位数和设置位置不尽相同。,2.专用寄存器(续),14,6.1.3 CPU的组成,CPU由运算器和控制器两大部分组成。控制器的主要功能有:从主存中取出一条指令,并指出下一条指令在主存中的位置。对指令进行译码或测试,产生相应的操作控制信号,以便启动规定的动作。指挥并控制CPU、主存和输入输出设备之间的数据流动方向。运算器的主要功能有:执行所有的算术运算;执行所有的逻辑运算
8、,并进行逻辑测试。,15,CPU的模型,图6-2 CPU的模型,16,6.1.4 CPU的主要技术参数,CPU品质的高低直接决定了一个计算机系统的档次,而CPU的主要技术参数可以反映出CPU的大致性能。1.字长 CPU的字长是指在单位时间内同时处理的二进制数据的位数。CPU按照其处理信息的字长可以分为:8位CPU、16位CPU、32位CPU以及64位CPU等。,17,内部工作频率又称为内频或主频,它是衡量CPU速度的重要参数。在其他性能指标相同时,CPU的主频越高,CPU的速度也就越快。内部时钟频率的倒数是时钟周期,这是CPU中最小的时间元素。每个动作至少需要一个时钟周期。最初的8086和80
9、88执行一条指令平均需要12个时钟周期;80286和80386的速度提高,每条指令大约要4.5个时钟周期;80486的速度进一步提高,每条指令大约2个时钟周期;Pentium具有双指令流水线,并有其他一些改进,使得每个时钟周期执行1到2条指令;而Pentium pro、Pentium/每个时钟周期可以执行3条或更多的指令。,2.内部工作频率,18,外部工作频率,也叫前端总线频率或系统总线时钟频率,它是由主板为CPU提供的基准时钟频率。由于正常情况下,CPU总线频率和主存总线频率相同,所以也是CPU与主存交换数据的频率。在早期,CPU的内频就等于外频。目前,CPU的内频越来越高,相比之下主存的速
10、度还很缓慢,如果外频设计得跟内频同步,则主存都将无法跟上CPU的速度。所以现在外频跟内频不再只是一比一的同步关系,从而出现了所谓的内部倍频技术,导致了“倍频”的出现。内频、外频和倍频三者之间的关系是:内频=外频倍频,3.外部工作频率,19,前端总线通常用FSB表示,它是CPU和外界交换数据的最主要通道,主要连接主存、显卡等数据吞吐率高的部件,因此前端总线的数据传输能力对计算机整体性能作用很大。在Pentium 4出现之前,前端总线频率与外频是相同的,因此往往直接称前端总线频率为外频。随着计算机技术的发展,需要前端总线频率高于外频,因此采用了QDR(Quad Date Rate)技术或者其他类似
11、的技术,使得前端总线频率成为外频的2倍、4倍甚至更高。数据带宽=总线频率数据位宽8,4.前端总线频率,20,快速通道互联(QPI)是取代FSB的基于包传输的高速点到点连接技术。QPI抛弃了FSB易混淆的单位MHz,而使用GT/s、MT/s,明确的表示总线实际的数据传输速率。一个基本的QPI数据包是80bit,需要四次传输完成每次整个数据包的传输,每次传输的20位数据中,有16位为有效数据,其余4位用于循环冗余校验。由于QPI是双向的,在发送的同时也可以接收另一端传输来的数据,这样,每个QPI总线总带宽=每秒传输次数(即QPI速率)每次传输的有效数据(即16bit/8=2Byte)双向。,5.Q
12、PI数据传输速率,21,片内Cache又称CPU Cache,它的容量和工作速率对提高计算机的速度起着关键的作用。CPU Cache可以分为L1 Cache、L2 Cache,部分高端CPU还具有L3 Cache。L1 Cache,位于CPU内核的旁边,是与CPU结合最为紧密的CPU缓存。一般来说,一级缓存可以分为一级数据缓存(D-Cache)和一级指令缓存(I-Cache)。L2 Cache是影响CPU性能的关键因素之一,在CPU核心不变化的情况下,增加L2 Cache的容量能使性能大幅度提高。,6.片内Cache的容量和速率,22,L3 Cache是为读取L2 Cache后未命中的数据设计
13、的种缓存,在拥有L3 Cache的CPU中,只有约5%的数据需要从内存中调用,这进一步提高了CPU的效率。7.工作电压 工作电压指的是CPU正常工作所需的电压。早期CPU的工作电压一般为5V,以致于CPU的发热量太大,使得寿命缩短。随着CPU的制造工艺与内频的提高,近年来各种CPU的工作电压逐步下降。,6.片内Cache的容量和速率(续),23,地址总线宽度决定了CPU可以访问的最大的物理地址空间,简单地说就是CPU到底能够使用多大容量的主存。9.数据总线宽度 数据总线宽度则决定了CPU与外部Cache、主存以及输入输出设备之间进行一次数据传输的信息量。数据总线和地址总线互相独立,数据总线宽度
14、指明了芯片的信息传递能力,而地址总线宽度说明了芯片可以处理多少主存单元。,8.地址总线宽度,24,线宽是指芯片内电路与电路之间的距离,可以用线宽来描述制造工艺。线宽越小,意味着芯片上包括的晶体管数目越多。Pentium 的线宽是0.35m,晶体管数达到7.5兆个;Pentium 的线宽是0.25m,晶体管数达到9.5兆个;Pentium 4的线宽是0.18m,晶体管数达到42兆个。近年来线宽已由0.15m、0.13m、90nm、65nm一直发展到目前主流的45nm和32nm,而22nm的制造工艺将是新一代CPU的发展目标。,10.制造工艺,25,控制器是计算机系统的指挥中心,它把运算器、存储器
15、、输入输出设备等部件组成一个有机的整体,然后根据指令的要求指挥全机的工作。,6.2 控制器的组成和实现方法,26,控制器的基本组成,图6-3 控制器的基本组成,27,1.指令部件 指令部件的主要任务是完成取指令并分析指令。指令部件包括:程序计数器指令寄存器指令译码器 暂存在指令寄存器中的指令只有在其操作码部分经过译码之后才能识别出这是一条什么样的指令,并产生相应的控制信号提供给微操作信号发生器。地址形成部件 根据指令的不同寻址方式,形成操作数的有效地址。,6.2.1 控制器的基本组成,28,2.时序部件,时序部件能产生一定的时序信号,以保证机器的各功能部件有节奏地进行信息传送、加工及信息存储。
16、包括:脉冲源 产生具有一定频率和宽度的时钟脉冲信号,为整个机器提供基准信号。启停控制逻辑 启停控制逻辑的作用是根据计算机的需要,可靠地开放或封锁脉冲,控制时序信号的发生或停止,实现对整个机器的正确启动或停止。,29,2.时序部件(续),节拍信号发生器 节拍信号发生器又称脉冲分配器。脉冲源产生的脉冲信号,经过节拍信号发生器后产生出各个机器周期中的节拍信号,用以控制计算机完成每一步微操作。,30,一条指令的取出和执行可以分解成很多最基本的操作,这种最基本的不可再分割的操作称为微操作。微操作信号发生器也称为控制单元(CU)。不同的机器指令具有不同的微操作序列。4.中断控制逻辑 中断控制逻辑是用来控制
17、中断处理的硬件逻辑。有关中断的问题将在第9章中专门进行讨论。,3.微操作信号发生器,31,控制器的核心是微操作信号发生器(控制单元CU)。微操作控制信号是由指令部件提供的译码信号、时序部件提供的时序信号和被控制功能部件所反馈的状态及条件综合形成的。控制单元的输入包括时序信号、机器指令操作码、各部件状态反馈信号等,输出的微操作控制信号又可以细分为CPU内的控制信号和送至主存或外设的控制信号。根据产生微操作控制信号的方式不同,控制器可分为组合逻辑型、存储逻辑型、组合逻辑与存储逻辑结合型3种,它们的根本区别在于控制单元的实现方法不同,而控制器中的其他部分基本上是大同小异的。,6.2.2控制器的硬件实
18、现方法,32,采用组合逻辑技术来实现,其控制单元是由门电路组成的复杂树形网络。这种方法是分立元件时代的产物,以使用最少器件数和取得最高操作速度为设计目标。最大优点是速度快。但是控制单元的结构不规整,使得设计、调试、维修较困难,难以实现设计自动化;一旦控制单元构成之后,要想增加新的控制功能是不可能的。因此,它受到微程序控制器的强烈冲击。目前仅有一些巨型机和RISC机为了追求高速度仍采用组合逻辑控制器。,1.组合逻辑型,33,这种控制器称为微程序控制器,是采用存储逻辑来实现的,也就是把微操作信号代码化,使每条机器指令转化成为一段微程序并存入一个专门的存储器(控制存储器)中,微操作控制信号由微指令产
19、生。微程序控制器具有设计规整、调试、维修以及更改、扩充指令方便的优点,易于实现自动化设计,已成为当前控制器的主流。但是,由于它增加了一级控制存储器,所以指令的执行速度比组合逻辑控制器慢。,2.存储逻辑型,34,这种控制器称为PLA(可编程逻辑阵列)控制器,是吸收前两种方法的设计思想来实现的。PLA控制器实际上也是一种组合逻辑控制器,但它又与常规的组合逻辑控制器的硬联结构不同;它是可编程序的,某一微操作控制信号由PLA的某一输出函数产生。PLA控制器是组合逻辑技术和存储逻辑技术结合的产物,克服了两者的缺点,是一种较有前途的方法。,3.组合逻辑和存储逻辑结合型,35,6.3 时序系统与控制方式,由
20、于计算机高速地进行工作,每一个动作的时间是非常严格的,不能有任何差错。时序系统是控制器的心脏,其功能是为指令的执行提供各种定时信号。,36,1.指令周期和机器周期 指令周期是指从取指令、分析取数到执行完该指令所需的全部时间。由于各种指令的操作功能不同,有的简单,有的复杂,因此各种指令的指令周期不尽相同。机器周期又称CPU周期。通常把一个指令周期划分为若干个机器周期,每个机器周期完成一个基本操作。一般机器的CPU周期有取指周期、取数周期、执行周期、中断周期等。所以有:指令周期i机器周期,6.3.1 时序系统,37,不同的指令周期中所包含的机器周期数差别可能很大。一般情况下,一条指令所需的最短时间
21、为两个机器周期:取指周期和执行周期。通常,每个机器周期都有一个与之对应的周期状态触发器。机器运行在不同的机器周期时,其对应的周期状态触发器被置“1”。显然,在机器运行的任何时刻只能处于一种周期状态,因此,有一个且仅有一个触发器被置“1”。,1.指令周期和机器周期(续),38,在一个机器周期内,要完成若干个微操作。因而应把一个机器周期分为若干个相等的时间段,每一个时间段对应一个电位信号,称为节拍电位信号。节拍的宽度取决于CPU完成一次微操作的时间。节拍的选取一般有以下几种方法:统一节拍法 以最复杂的机器周期为准定出节拍数,每一个节拍时间的长短也以最繁的微操作作为标准。这种方法采用统一的、具有相等
22、时间间隔和相同数目的节拍,使得所有的机器周期长度都是相等的,因此称为定长CPU周期。,2.节拍,39,分散节拍法 按照机器周期的实际需要安排节拍数,需要多少节拍,就发出多少节拍,这样可以避免浪费,提高时间利用率。由于各机器周期长度不同,故称为不定长CPU周期。延长节拍法 在照顾多数机器周期要求的情况下,选取适当的节拍数,作为基本节拍。如果在某个机器周期内统一的节拍数无法完成该周期的全部微操作,则可以延长一或两个节拍。,2.节拍(续),40,时钟周期插入 在一些微型机中,时序信号中不设置节拍,而直接使用时钟周期信号。一个机器周期中含有若干个时钟周期,时钟周期的数目取决于机器周期内完成微操作数目的
23、多少及相应功能部件的速度。一个机器周期的基本时钟周期数确定之后,还可以不断插入等待时钟周期。如8086的一个总线周期(即机器周期)中包含四个基本时钟周期T1T4,在T3和T4之间可以插入任意个等待时钟周期TW,以等待速度较慢的存储部件或外部设备完成读或写操作。,2.节拍(续),41,在节拍中执行的有些微操作需要同步定时脉冲,如将稳定的运算结果打入寄存器,又如机器周期状态切换等。为此,在一个节拍内常常设置一个或几个工作脉冲,作为各种同步脉冲的来源。工作脉冲的宽度只占节拍电位宽度的,并处于节拍的末尾部分,以保证所有的触发器都能可靠、稳定地翻转。在只设置机器周期和时钟周期的微型机中,一般不再设置工作
24、脉冲,因为时钟周期既可以作为电位信号,其前、后沿又可以作为脉冲触发信号。,3.工作脉冲,42,图6-6为小型机每个指令周期中常采用的机器周期、节拍、工作脉冲三级时序系统。图中每个机器周期M中包括四个节拍T1T4,每个节拍内有一个脉冲P。在机器周期间、节拍电位间、工作脉冲间既不允许有重叠交叉,也不允许有空隙,应该是一个接一个的准确连接。,4.多级时序系统,43,三级时序系统,图6-6 三级时序系统,44,1.同步控制方式 同步控制方式即固定时序控制方式,各项操作都由统一的时序信号控制,在每个机器周期中产生统一数目的节拍电位和工作脉冲。由于不同的指令,操作时间长短不一致。同步控制方式应以最复杂指令
25、的操作时间作为统一的时间间隔标准。,6.3.2 控制方式,45,这种控制方式设计简单,容易实现;但是对于许多简单指令来说会有较多的空闲时间,造成较大数量的时间浪费,从而影响了指令的执行速度。在同步控制方式中,各指令所需的时序由控制器统一发出,所有微操作都与时钟同步,所以又称为集中控制方式或中央控制方式。,1.同步控制方式(续),46,异步控制方式即可变时序控制方式,各项操作不采用统一的时序信号控制,而根据指令或部件的具体情况决定,需要多少时间,就占用多少时间。这是一种“应答”方式,各操作之间的衔接是由“结束起始”信号来实现的。由前一项操作已经完成的“结束”信号,或由下一项操作的“准备好”信号来
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中央处理器
链接地址:https://www.31ppt.com/p-5335464.html