第三章微处理器体系结构及关键技术.ppt
《第三章微处理器体系结构及关键技术.ppt》由会员分享,可在线阅读,更多相关《第三章微处理器体系结构及关键技术.ppt(67页珍藏版)》请在三一办公上搜索。
1、第3章 微处理器关键技术,微处理器基本功能及硬件组成微处理器体系结构随机逻辑体系结构RISC结构,目标是减小电路规模并降低制造费用微码体系结构 CISC结构,目标是减少重复设计费用、增强CPU性能流水线体系结构 利用指令并行以提高计算机的性能超标量体系结构 利用多条流水线进一步提高计算机性能指令系统设计计算机工作过程,1/68,第三章习题,作业:1、2、7、9、11、13 思考:36、8、10、12、15、16,2023-6-23,2/68,第三章结 束,2023-6-23,3/68,CPU的基本功能,CPU的作用是协调和控制计算机的各个部件并执行程序中的指令序列,因此应具有以下基本功能:,取
2、指令:当程序已在存储器中时,首先根据程序入口地址取出一条程序,为此要发出指令地址及控制信号。分析指令:即指令译码,是指对当前取得的指令进行分析,指出它要求什么操作,并产生相应的操作控制命令。执行指令:根据分析指令时产生的“操作命令”形成相应的操作控制信号序列,通过运算器、存储器及输入/输出设备的执行,实现每条指令的功能,其中包括对运算结果的处理以及下条指令地址的形成。,2023-6-23,4/68,CPU的基本功能模型,编程人员看到的CPU,2023-6-23,5/68,中央处理单元 Central Processing Unit,CPU微处理器 Micro Processing Unit,M
3、PU微控制单元 Micro Control Unit,MCU单片机计算机,单片芯片,控制器、运算器、寄存器,CPU、少量存储器及I/O接口,CPU+存储器+总线/接口+外设,几个概念的对比,2023-6-23,6/68,控制单元(控制器)时序控制部件:指令周期、工作周期、时钟周期(工作脉冲)指令译码逻辑:微程序(CISC)、硬连逻辑(RISC)数据通道(运算器)组成:ALU+寄存器+内部总线功能:基本的二进制算术、逻辑及移位运算;根据运算结果设置状态标志(进/借位、溢出等);特性:数据通路宽度:即字长,CPU单次传送和处理数据的能力。数据通路周期:ALU运算并将保存结果的过程。,CPU的硬件组
4、织,7/68,时序控制部件,时序控制部件:脉冲源+分频逻辑;用以产生各种系统所需的、满足时序要求的控制信号。指令周期 读取并执行一条指令所需的时间工作周期 指令周期中的不同工作阶段时钟周期 系统中最小的基本时间分段,指令周期状态图,CPU中的多级时序,不同的CPU设计策略:CISC与RISC,CISC(Complex Instruction Set Computer,复杂指令集计算机)不断增强原有指令的功能以及设置更为复杂的新指令取代原先由程序段完成的功能,从而实现软件功能的硬化。RISC(Reduced Instruction Set Computer,精简指令集计算机)通过减少指令种类和简
5、化指令功能来降低硬件设计复杂度,从而提高指令的执行速度。现代计算机:RISC+CISC,2023-6-23,9/68,CISC的特点及设计思想,美国加州大学Berkeley分校的研究结果表明:许多复杂指令很少被使用,“2-8原则”控制器硬件复杂(指令多,且具有不定长格式和复杂的数据类型),占用了大量芯片面积,且容易出错,VLSI设计困难。指令操作繁杂,执行速度慢。指令规整性不好,不利用采用 流水线技术提高性能。,2023-6-23,10/68,RISC的特点及设计思想,RISC机的设计应当遵循以下五个原则:指令条数少,格式简单,易于译码;提供足够的寄存器,只允许load 和store指令访问内
6、存;指令由硬件直接执行,在单个周期内完成;充分利用流水线;强调优化编译器的作用;,2023-6-23,11/68,典型的数据通路结构,ALU的实现:(1)由基本门电路实现全加器;(2)由n位全加器构成n位并行加法器(3)以加法器为核心,通过扩展输入选择逻辑实现其它基本算术和逻辑运算;,2023-6-23,12/68,ALU功能描述示例,算术逻辑运算功能,移位运算功能,2023-6-23,CPU数据通路的RTL模型(Register Transfer Level),2023-6-23,14/68,CISC与RISC的数据流,2023-6-23,15/68,微处理器体系结构分类,16/68,随机逻
7、辑(硬连逻辑)体系结构用布尔逻辑函数来表示控制单元的输入和输出之间的关系。,随机逻辑CPU的体系结构,时序部件,指令预处理,2023-6-23,17/68,随机逻辑CPU的操作1-取指令,程序计数器的值经MUX送到存储器;存储器送回的指令写入指令寄存器;程序计数器加1后回写;,2023-6-23,18/68,随机逻辑CPU的操作2-指令译码与执行,寄存器堆中的某个地址寄存器通过MUX寻址存储器,获得ALU的一个操作数;另一个操作数来自于寄存器堆中的数据寄存器;ALU的结果值被回写入寄存器堆。,2023-6-23,19/68,随机逻辑CPU的设计步骤,指令集结构驱动硬件的逻辑方程 定义所需的指令
8、集结构;根据指令集决定硬件逻辑及有限状态机;硬件逻辑方程反馈到指令集结构 对指令集结构做必要的修改和优化;最大限度地减少逻辑复杂度;,2023-6-23,20/68,最小化逻辑门数目优化硬件逻辑、尽可能地少用触发器优化硬件时序逻辑门级数最小化;建立并行通路以减少时序约束(增加逻辑门)简化指令集逻辑简单、寄存器数量少,随机逻辑CPU的设计要点,RISC,2023-6-23,21/68,随机逻辑CPU的特点,优点:可通过简化指令减少所使用的门电路总数从而减少制造费用。缺点:指令集结构与硬件逻辑方程之间存在着密切联系,设计过程复杂。重用性差,设计成果很少能再利用到以后的新CPU设计中。适用于较简单的
9、指令集结构。,2023-6-23,22/68,微码CPU的体系结构,在微码结构中,控制单元的输入和输出之间的关系被视为一个存储系统。,时序部件,指令预处理,工作原理 微程序控制,又称存储控制。组成微码控制器+微代码,2023-6-23,23/68,微码CPU的控制逻辑与控制流,控制逻辑对IR中的指令译码,确定对应微码程序地址并写入PC;PC向微码ROM提供地址,返回的微码写入IR;IR译码后产生相应的控制信号;PC地址加1后获取下一条微指令地址,直到完成整个微码程序;,2023-6-23,微码CPU的数据通路与数据流,数据通路一般应有如下三个基本的时钟周期:从存储器读数据后:写入寄存器堆(Re
10、gister File);写入指令寄存器(IR);写入临时寄存器(TempIn);作为ALU的一个输入;从寄存器读数据后:写入存储器地址寄存器MAR;写入临时寄存器作为ALU的一个输入;存入存储器;将Result寄存器内容写入寄存器堆,或存入存储器,2023-6-23,25/68,微码CPU的设计步骤,建立硬件体系结构 保证其具备执行必要基本功能步骤的功能。将指令分割成许多微步骤,转写成微程序并写入控制存储器ROM。,微指令Micro-instruction微程序Micro-program(固件fireware)指令instruction微码控制器Microcode controller(定序
11、器sequencer),2023-6-23,26/68,微码CPU的特点,优点:可以通过减少取指令次数的方法来降低存储器总访问时间从而提高系统性能;简化硬件设计,可使其成品机器几乎没有设计上的错误;建立或改动微代码比建立或改动电路省时、不易出错,因此创建新的CPU版本将会更快;缺点:微代码比硬件实现的开销大;宏指令的开销依赖于微指令系统;,2023-6-23,27/68,微码结构与随机逻辑结构的比较,硬件设计开销随机逻辑CPU的硬件和指令集必须同步进行设计和优化,因此比较复杂。微码CPU的指令集设计并不直接影响现有硬件,修改指令集并不需要重新设计新的硬件。性能如果采用相同指令集,则随机逻辑CP
12、U操作会更快。如果执行相同的计算任务,微码CPU能够通过使用更少(但更复杂)的指令达到更高性能。当系统整体性能受限于存储器的速度时,微码CPU对性能提高的优势更为明显。,2023-6-23,28/68,流水线技术,可通过分割逻辑,插入缓冲寄存器(流水线Reg)来构建;利用指令级并行以提高计算机的性能;,流水线满载,独立硬件模块,2023-6-23,指令时空图,顺序执行,4级流水线执行,流水线满载,30/68,四级流水线CPU的操作,(1)取指令级将下一条指令的地址发送到指令存储器,并等待此指令返回。(2)指令译码级指令译码并从寄存器中取出所需的源操作数。(3)指令执行级执行运算,并将其结果送至
13、下一阶段;而存储器取存指令则利用此阶段从存储器中完成数据的取存操作(4)数据回写级 将数据写回到寄存器或者数据存储器,或在决定分支跳转时写入地址寄存器给出下一个指令的地址。,31/68,流水线CPU中双存储器访问的操作,所有ALU指令都限制为仅可对寄存器进行;只有存储器取存指令才能读写存储器;a)从存储器取出(LOAD):Mem(Reg 1)Reg 2b)写入存储器(STORE):Reg 1Mem(Reg 2)否则会需要更多级流水线;,2023-6-23,32/68,流水线CPU的性能,吞吐量(throughput)单位时间完成的作业,最大值等于每一时钟周期1个作业。等待时间(latency)
14、每一作业从开始到结束需用时钟周期数d。深度(depth)或并行度(degree of parallelism)即流水线的级数d。加速比非流水线执行时间相对流水线执行时间之比。如果d级流水线每级需用一个时钟周期T,则N条指令的总执行时间:Tpipeline=Tload+Tempty=(N+(d-1)*T 则该流水线的加速比为:Tunpipeline/Tpipeline=Nd/(N+d-1),2023-6-23,33/68,流水线结构与微码结构的比较1,指令集的限制微码机器中指令可以任意复杂;流水线机器中指令越复杂所需的级数就越多;指令的并行性微码机器中指令的各微码执行阶段必须依次执行流水线机器容
15、许同时执行不同指令;提高性能的手段微码机器通过减少存储器读来提高性能;流水线机器通过增加硬件实现指令的并行来提高性能;,2023-6-23,34/68,流水线结构与微码结构的比较2,比较下列操作在微码CPU和流水线CPU中的执行情况:Mem(Reg 1)+Mem(Reg 2)Reg 3微码机器(CISC)中只需要一条指令表示,而在流水线机器(RISC)里则需要3条指令;假设没有存储器延迟,则流水线机器中这3条指令可以在3个时钟周期内完成,而微码机器则需要8个时钟周期。在流水线机器中需要取存5次存储器,而微码机器只需要3次。若存储器较慢,则微码CPU的执行速度可能更快,3次指令,2次数据,1次指
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 微处理器 体系结构 关键技术

链接地址:https://www.31ppt.com/p-5298291.html