书签分享收藏举报版权申诉 / 110

立即下载加入VIP免费专享

当前位置：首页 > 生活休闲 > 在线阅读 > 计算机系统结构简介课件.ppt

计算机系统结构简介课件.ppt

上传人：牧羊曲112

文档编号：4031402

上传时间：2023-04-01

格式：PPT

页数：110

大小：939.50KB

《计算机系统结构简介课件.ppt》由会员分享，可在线阅读，更多相关《计算机系统结构简介课件.ppt（110页珍藏版）》请在三一办公上搜索。

1、1.1 计算机系统结构简介,计算机性能,1.提高处理机运算速度：MIPSFz IPC 其中:Fz为处理机的工作主频 IPC(Instruction Per Cycle)为每个时钟周期平均执行的指令条数。提高IPC：依靠先进系统结构过去，几个或几十个周期完成一条指令现在，一个周期完成几条指令。提高Fz：缩短门电路延迟，依靠技术进步流水线技术等，依靠先进系统结构从指令串行执行，到P4的20级流水线。,2.计算机性能提高的几个阶段 20世纪70年代末之前，大型机和小型机计算机性能每年提高25%30%。20世纪80年代初，出现微处理机，依靠集成电路技术，性能每年提高35%20世纪80年中期，

2、出现RISC技术、高级语言和操作系统等，性能每年提高50%1995年，先进系统结构对微处理器性能的贡献是单纯技术进步的5倍。3.近几年及将来，计算机性能按摩尔定理发展。4.计算机系统的设计者们要不断创新。,1、虚拟计算机,定义：从不同角度所看到的计算机系统的属性是不同的。虚拟计算机指通过软件模拟的具有完整硬件系统功能的，运行在一个完全隔离环境中的完整计算机系统。主要观察角度包括：应用程序员系统程序员硬件设计人员对计算机系统的认识通常只需要在某一个层次上,虚拟计算机系统,2、计算机系统的层次结构,计算机系统可分为7个层次第3级至第6级由软件实现,称为虚拟机。从学科领域来划分：第0级和第1级

3、属于计算机组成原理；第2级属于计算机系统结构；第3至第5级属于系统软件；第6级属于应用软件；它们之间有交叉例如：第3级必须依赖第4级和第5级来实现。,计算机系统的层次结构,计算机系统的层次结构,虚拟机：由软件实现的机器。语言实现的两种基本技术翻译：先把N+1级程序全部变换成N级程序后，再去执行新产生的N级程序，在执行过程中 N+1级程序不再被访问。解释：每当一条N+1级指令被译码后，就直接去执行一串等效的N级指令，然后再去取下一条N+1级的指令，依此重复进行。解释执行比翻译花的时间多，但存储空间占用较少。,3、透明性概念,定义：本来存在的事物或属性，从某种角度看似乎不存在。例如：CPU

4、类型、型号、主存储器容量等对应用程序员透明对系统程序员、硬件设计人员等不透明例如：浮点数表示、乘法指令对高级语言程序员、应用程序员透明对汇编语言程序员、机器语言程序员不透明例如：数据总线宽度、微程序对汇编语言程序员、机器语言程序员透明对硬件设计人员、计算机维修人员不透明,深入体会,计算机系统结构的定义,经典的计算机系统结构定义一 C.M.Amdahl于1964年在推出IBM360系列计算机时提出：程序员所看到的计算机系统的属性,即概念性结构和功能特性。通常，低级机器的属性对于高层机器程序员基本是透明的，计算机体系结构主要指机器语言级机器的系统结构。按照计算机系统的多级层

5、次结构，不同级程序员所看到的计算机具有不同的属性。在计算机技术中，对这种本来是存在的事物或属性，但从某种角度看又好象不存在。程序员：系统程序员（包括：汇编语言、机器语言、编译程序、操作系统）。看到的：编写出能在机器上正确运行的程序所必须了解到的。,概念性结构 IBM360系列计算机的概念性结构,功能特性：指令系统及其执行模式,数据表示：硬件能够直接认别和处理的数据类型；寻址技术：编址方式、寻址方式和定位方式等；寄存器组织：操作数寄存器、变址寄存器、控制寄存器及专用寄存器的定义、数量和使用规等；指令系统：操作类型、格式，指令间的排序控制等；中断系统：中断类型、中断级别和中断响应方式等；存储系统

6、：寻址空间、虚拟存储器、Cache存储等；处理机工作状态：定义和切换方式，如管态和目等；输入输出系统：数据交换方式、交换过程的控制等；信息保护：信息保护方式和硬件对信息保护的支持等。,计算机系统结构定义二,研究软硬件功能分配和对软硬件界面的确定计算机系统由软件、硬件和固件组成，它们在功能上是同等的。同一种功能可以用硬件实现，也可以用软件或固件实现。不同的组成只是性能和价格不同,他们的系统结构是相同的。系列计算机概念：相同系统结构,不同组成和实现的一系列计算机系统。,程序员所看到的计算机系统的属性,即概念性结构和功能特性。,计算机组成技术,1.课程名称 Computer Organizatio

7、n 计算机组成，计算机组织，计算机原理，计算机组成原理2.研究方法从内部研究计算机系统计算机组成是指计算机系统结构的逻辑实现。3.主要研究内容确定数据通路的宽度；确定各种操作对功能部件的共享程度；确定专用的功能部件；确定功能部件的并行度；设计缓冲和排队策略；设计控制机构；确定采用何种可靠性技术。,计算机实现技术,计算机实现是指计算机组成的物理实现。主要包括：处理机、主存储器等部件的物理结构；器件的集成度和速度；专用器件的设计；器件、模块、插件、底版的划分与连接；信号传输技术；电源、冷却及装配技术，制造工艺及技术等。随着技术、器件和应用的发展，它们三者之间的界限越来越模糊。,1.2 计算机系

8、统的评价标准,运算速度是表示处理机性能的主要指标。有多种表示处理机运算速度的方法。哪一种表示方法合理？1.时钟频率（处理机主频）只能用于同一公司、同一类型、同一配置的处理机如：Pentium4 2.0G比Pentium4 1.6G快25%?Pentium4 2.4G比Pentium4 1.6G快50%?只表示CPU的指令处理能力。实际运算速度还与Cache、内存、I/O、被执行程序等均有关。,2.指令执行速度,一种经典的表示运算速度的方法 MIPS(Million Instructions Per Second),GIPS,TIPS(million,billion,trillion)其中:F

9、z为处理机的工作主频 CPI(Cycles Per Instruction)为每条指令所需的平均时钟周期数 IPC(Instruction Per Cycle)为每个时钟周期平均执行的指令条数,例1：计算 Pentium IV 2GHz 处理机的指令执行速度,解：由于 PentiumIV 2GHz 处理机的 IPC4（或CPI0.25）,Fz2000MHz 因此，MIPSPentiumIV2GFzIPC20004 8000MIPS8GIPS 即每秒钟80亿次(平均每秒钟执行80亿条指令)主要优点：直观、方便。目前还经常使用主要缺点:(1)不同指令的执行速度差别很大；(2)指令使用频度差别

10、很大；(3)有相当多的非功能性指令；,3.等效指令速度：吉普森（Gibson）法：加减法50，乘法15，除法5，程序控制15，其他15 静态指令使用频度：在程序中直接统计动态指令使用频度：在程序执行过程中统计,例2：我国早期研制的一种小型计算机DJS-130定点16位，加法指令每秒50万次，但没有硬件乘除法指令。用软件实现乘除法，速度低100倍左右。求等效指令速度。,解：等效指令速度为：,即每秒2万次，由于用软件实现乘除法，等效指令速度降低了25倍。,例3：假设在一般程序中浮点开平方操作FPSQR所占的比例为2，它的CPI为100；其他浮点操作FP所占的比例为23，它的CPI4.0；其余75

11、指令的CPI1.33，计算该处理机的等效CPI。如果FPSQR操作的CPI也为4.0，重新计算等效CPI。,解：等效CPI110024231.33753.92等效CPI24251.33752.00,改进了在用户程序中仅占2的开平方操作，整个机器的等效运算速度提高了近一倍。,4.指令执行速度的 4 种平均方法算术平均：调和平均(用速率来度量)：加权平均加权算术平均：加权调和平均：,几何平均：其中：n 指不同的程序，ETR(execution time ratio)i是第i个程序相对于参考机器正交化后的执行时间几何平均速度与所参考的机器无关，有如下性质：几何平均值的比率等于比率的几何平均值,运

12、行程序P1时，A的速度是B的10倍；运行程序P2时，B的速度是A的10倍；运行程序P1时，A的速度是C的20倍；运行程序P2时，C的速度是A的50倍；运行程序P1时，B的速度是C的2倍；运行程序P2时，C的速度是B的5倍。,算术平均：程序P1和P2各执行1次，B的速度是A的9.1倍；程序P1和P2各执行1次，C的速度是A的25倍；程序P1和P2各执行1次，C的速度是B的2.75倍。结论：执行程序P1和P2相同次数，机器A最慢，机器C最快算术平均速度：三台机器的速度之比为：A：B：C=1：9.1：25,加权算术平均加权算术平均W1三台机器的速度：A B C加权算术平均W2三台机器的速度：A

13、C B加权算术平均W3三台机器的速度：C B A,几何平均几何平均值与所参考的机器无关，机器A与机器B的性能相同，机器C的执行时间是机器A或机器B 的0.63倍。执行程序P1和P2的总时间，机器A几乎是机器B的10倍。,5.核心程序法把应用程序中使用最频繁的那部分程序作为评价计算机性能的标准程序。称为基准测试程序(benchmark)整数测试程序：Dhrystone 用C语言编写,100条语句。包括：各种赋值语句,数据类型和数据区,控制语句,过程调用和参数传送,整数运算和逻辑操作等。VAX-11/780的测试结果为每秒1757个Dhrystones，即：1VAX MIPS1757 Dhry

14、stonesSecond 浮点测试程序：Linpack 用FORTRAN编写，主要是浮点加法和浮点乘法操作用 MFLOPS(Million Floating Point Operations Per Second)表示，GFLOPS、TFLOPS,SPEC基准程序 System Performance Evaluation Cooperative 由30个左右世界知名计算机大厂商所支持的非盈利性国际合作组织，包括：IBM、AT&T、BULL、Compaq、CDC、DG、DEC、Fujitsu、HP、Intel、MIPS、Motolola、SGI、SUN、Unisys等；1989年10月宣布S

15、PEC1.0，程序量超过15万行,包含4个定点程序和6个浮点程序,测试结果用SPECint89和SPECfp89表示。1992年增加到有6个定点程序和14个浮点程序,测试结果用SPECint92和SPECfp92表示。1995年推出SPECint95和SPECfp95 SPEC2000，12个定点程序、14个浮点程序,SPEC基准测试程序举例,处理机 SPECint95 SPECfp95 PentiumII 450 18.5 13.3 PentiumIII 450 18.7 13.7 PentiumIII 500 20.6 14.7 PientiumIII 550 22.3 15.6 Cele

16、ron 300A 12.0 9.66 Celeron 333 13.1 10.20 Celeron 366 14.1 10.70 Celeron 400 15.1 11.20 Celeron 433 16.1 11.60 Celeron 466 17.0 12.00,Pentium4性能评测数据（数据全部来源于Intel网站）,6.峰值速度,峰值指令速度：MIPS、GIPS、TI PS 浮点蜂值速度：MFLOPS、GFLOPS、TFLOPS例5：一个由36台计算机组成的Cluster系统，每台计算机内部由4个Pentium III 700，计算这个Cluster系统的指令峰值速度。解：Pen

17、tiumIII 700MHz，有3条指令流水线，峰值指令速度为：700 3 2100MIPS Cluster的峰值指令速度700 36 302 400MIPS 即每秒千亿次,存储系统,1.存储层次第1层：Register Files(寄存器堆)第2层：Lookahead(先行缓冲站)第3层：Cache(高速缓冲存储器)第4层：Main Memory(主存储器)第5层：Online Storage(联机存储器)第6层：Off-line Storage(脱机存储器)第13层在CPU芯片内部，第4层在主板上，第5层在机箱内(硬盘)，第6层依靠手工加载(VCD/DVD/磁带/刻录机等),2.寻址空间

18、程序员可以使用的存储器容量，即每个程序的大小通常有216、224、232、264、Pentium处理机的寻址空间为4GB 与实际配置的存储器容量无关3.存储容量实际物理存储器的大小通常用KB、MB、GB等表示建议配置：主存：128MB512MB 硬盘：40GB137GB,4.主存储器的种类 SDRAM(Synchronous Dynamic Random Access Memory)RDRAM(RAMBUS DRAM)DDR(Dual Date Rate DRAM)5.速度主存度与CPU系统总线速度相匹配 P4系统总线速度400MHz(3200MB/S)或533 DDR:64bits

19、333MHz/8=2700MB/S RDRAM:16bits800MHz/82=3200MB/S 6.存储系统采用软件和硬件相结合的方法，获得速度高、容量大、价格便宜的存储器,SDRAM是Synchronous Dynamic Random Access Memory（同步动态随机存储器）的简称，是前几年普遍使用。采用3.3v工作电压，带宽64位，SDRAM将CPU与RAM通过一个相同的时钟锁在一起，使RAM和CPU能够共享一个时钟周期，以相同的速度同步工作。SDRAM基于双存储体结构，内含两个交错的存储阵列，当CPU从一个存储体或阵列访问数据时，另一个就已为读写数据做好了准备，通过这两个存

20、储阵列的紧密切换，读取效率就能得到成倍的提高。SDRAM不仅可用作主存，在显示卡上的显存方面也有广泛应用。DDR SDRAM是Double Data Rate Synchronous Dynamic Random Access Memory（双数据率同步动态随机存储器）的简称，是由VIA等公司为了与RDRAM相抗衡而提出的内存标准。DDR SDRAM是SDRAM的更新换代产品，采用2.5v工作电压，它允许在时钟脉冲的上升沿和下降沿传输数据，这样不需要提高时钟的频率就能加倍提高SDRAM的速度，并具有比SDRAM多一倍的传输速率和内存带宽。,其他性能,1.字长 1几百位，16位、32位、64位

21、由数据字长决定，8的倍数，32位、64位等可变字长：任意组合2.数据表示定点、浮点、逻辑、向量、串、栈、树、发展方向之一：自定义数据表示3.指令系统 CISC(Complex Instruction Set Computer)复杂指令集计算机 RISC(Reduced Instruction Set Computer)精简指令集计算机 VLIW(Very Long Instruction Word)超长指令字,4.输入输出系统输入输出系统的组织方式中断系统通道处理机输入输出处理机5.保护和诊断能力程序与数据的保护诊断能力：检错,纠错,冗余,自诊断能力可靠性：RAS技术，可靠性

22、R，可用性A，可维护性S,价格标准,1价格与性能的关系：摩尔定理：速度每10年左右提高100倍，但价格基本维持不变。用当前同样的价格，在5年之后能买到性能高出10倍的计算机。2硬件与软件的价格比例：硬件在整个计算机系统价格中所占的比例在下降，软件所占的比例在上升。目前软件价格已经超过硬件价格。,软件所占的成本越来越高,计算机系统的设计技术,1、计算机设计者的任务2、软硬件取舍3、软件兼容性4、计算机系统设计方法,一、计算机设计者的任务,系统结构设计：包括指令集、存储系统、总线结构、处理器设计等，是软硬件的分界面。硬件实现技术：相当重要，不同指令集对系统性能的影响在缩小。应用或市场需求性能优化：

23、可靠性、容错性、价格与性能。实现的复杂性：硬件实现方案、软件复杂性、投放市场时间。性能价格比：必须考虑实现的成本，包括软件成本。,二、软硬件取舍,1.软硬件的关系理论上有两种极端实现方法：全硬件机器：操作系统、高级语言、应用等。全软件机器:硬件只有1位加法和分支操作，其他都用软件。关键问题：性能与价格的关系。软件与硬件实现的特点硬件实现：速度快、成本高；灵活性差、占用内存少。软件实现：速度低、复制费用低；灵活性好、占用内存多。,集成电路的基本制造工艺：1.首先生产圆片(研磨、抛光)；2.在圆片上制造出大量电路单元（光刻掩膜版、涂胶、曝光、显影、掺杂技术）；3.园片经过测试后按照制造的电路单元

24、被切割成基片；4.基片在外壳中封装好以后就是集成电路成品。,集成电路的圆片和基片,园片成本、园片成品率、值及疵点密度等;由生产工艺决定；基片面积由设计人员控制。,硬件实现的比例越来越高,2.从价格因素考虑的软硬件取舍假设：硬件设计费为Dh、软件设计费为Ds、硬件拷贝费为Ch、软件拷贝费为Cs，R为软件重复出现次数(占用内存、占用介质)，当台数为V时，每台的硬件费用和软件费用之比为：由于：Dh Ds，Ch Cs，当R很大时，经常使用的基本功能适宜用硬件实现由于：Ds Cs，当V很大时，生产台数很多时适宜用硬件实现,三、从改进性能考虑的软硬件取舍基本方法：加快经常性事件的执行速度。Amdahl

25、定律：系统中某一部件由于采用更快的执行方式后，整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。在Amdahl定律中，加速比与两个因素有关：,例如：系统改进后执行程序，其中可改进部分花费2秒时间，而改进前该部分需花费5秒，则性能提高为5/2。用“部件加速比”表示性能提高比，一般情况下它是大于1的。系统加速比=改进前：改进后总执行时间,部件改进后系统的总执行时间=不可以改进的总时间+可以改进部分改进后的执行时间即：改进后的总执行时间（1可改进比例）*改进前总执行时间+(可改进比例*改进前总执行时间)/部件加速比改进前总执行时间*(1-可改进比例)+可改进比例/部件加速比,系统加

26、速比改进前总执行时间/改进后总执行时间1/(1-可改进比例)+可改进比例/部件加速比P13,Amdahl定律的三个推论：A、Amdahl定律还表达了一种性能增加的递减规则：如果仅仅对计算机中的某一部分做性能改进，则改进越多，系统获得的效果越小；B、如果只针对整个任务的一部分进行优化，那么所获得的加速比不大于1/(1-可改进比例)；C、Amdahl定律告诉我们如何衡量一个“好”的计算机系统：具有高性价比的计算机是一个带宽平衡的系统，而不是看它使用的某些部件的性能。,改进后整个任务的执行时间为：其中：0为改进前的整个任务的执行时间。改进后整个系统的加速比达到：其中：Fe表示可改进部分所占的百分比，

27、(1-Fe)表示不可改进部分所占的百分比，Se表示改进后，可改进部分的加速比。,例5：某部件的处理时间仅为整个运行时间的 40%，如果将该部件的处理速度加快到10 倍，则采用加快措施后能使整个系统的性能提高多少？解：由题意可知：Fe=0.4,Se=10，根据Amdahl定律，加速比为：,四、改进性能的主要途径(1)面向目标代码改进方法：用一条指令代替一串指令根据计算结果改进：例如，增加硬件乘法和硬件除法指令能够,使等效指令速度提高25倍，据统计数据改进指令功能：如数据传送指令、快速保存与恢复现场指令等增加运算型指令的功能：如函数运算指令等,(2)面向高级语言和编译程序改进：方法：增强对

28、高级语言和编译程序支持的指令的功能例如：在do循环中，循环体只有一二条的占60%左右，增加循环控制指令。例如：条件码对高级语言几乎无用，在并行计算机中已经取消条件码。,(3)面向操作系统改进：系统结构设计要规整，消除例外情况。寄存器定义要统一(如 A 寄存器等)操作要均匀(如 A-B 与 B-A)所有的存储部件都要对称进程的管理和切换存储管理和信息保护进程的同步与互斥，信号灯管理处理机工作状态和访问方式的转换这类指令的使用频度往往很低，但必须设置,软件兼容性设计方法,原因：软件相对于硬件的成本越来越贵，已积累了大量成熟的系统软件和应用软件。1.兼容种类(1)向后兼容：在某一时间生

29、产的机器上运行的目标软件能够直接运行于更晚生产的机器上。(2)向前兼容：(3)向上兼容：在低档机器上运行的目标软件能够直接运行于高档机器上。(4)向下兼容：向后兼容必须做到，向上兼容尽量做到。向前兼容和向下兼容，可以不考虑。,方法一：系列机方法系列机定义:具有相同的系统结构，但组成和实现技术不同的一系列计算机系统实现方法：在系统结构基本不变的基础上，根据不同的性能和不同的器件，研制出多种性能和价格不同的计算机系统。一种系统结构可以有多种组成，一种组成也可以有多种物理实现如IBM370系列机:115,125,135,145,158,168等,相同的指令系统，采用顺序执行、重迭、流水和并行处

30、理方式相同的32位字长，数据通路宽度为8位、16位、32位、64位。如PC系列机有：不同主频：4.7MHz，500MHz，1GHz，2.4GHz,3GHz,不同扩展：Pentium、Pentium Pro、Pentium MMX、Pentium SSE、Pentium SSE2 不同Cache：Pentium、Celeron、Xeon 不同字长：8位、16位、32位、64位,采用系列机方法的主要优点：(1)系列机之间软件兼容，可移植性好(2)插件、接口等相互兼容(3)便于实现机间通信(4)便于维修、培训(5)有利于提高产量、降低成本采用系列机方法的主要缺点：限制了计算机系统结构的发展如PC

31、系列机，其系统结构非常落后，使用也最普及,方法二：模拟与仿真 Simulation Emulation,定义：在一台现有的计算机上实现另一台计算机的指令系统。全部用软件实现的叫模拟，用软件、硬件、固件混合实现的叫仿真模拟的实现方法在A计算机上通过解释或编译实现B计算机的指令系统。A机器称为宿主机，B机器称为虚拟机。仿真的实现方法直接用A机器的一段微程序解释执行B机器的指令。A机器称为宿主机，B机称为目标机。,优缺点比较模拟方法速度低，仿真方法速度高仿真需要较多的硬件（包括控制存储器）系统结构差别大的机器难于用仿真方法实现除了指令系统之外，还有存储系统、I/O系统、中断系统、控制台的操

32、作等模拟方法用于计算机系统的设计过程在一台已有的机器上用模拟方法实现正在设计中的机器的指令系统等。具体过程如下：,方法三：统一高级语言实现方法：采用同一种不依赖于任何具体机器的高级语言编写系统软件和应用软件。困难：至今还没有这样一种高级语言，短期内很难实现。C、Ada、Java、三种方法比较：采用统一高级语言最好，是努力的目标;系列机是暂时性方法，也是目前最好的方法仿真的速度低，芯片设计的负担重，目前用于同一系列机内的兼容，1/101/2的芯片面积用于仿真,方法四：目标代码的并行编译技术新的研究课题:一种机器的目标代码重新编译到另一种机器的并行目标代码两种方法：(1)动态代码转换例1

33、：IBM公司研制 DAISY(Dynamically Architected Instruction Set from Yorktown)处理机例2：Transmeta公司研制Crusoe处理机已经大量应用于笔记本计算机，其功耗很低。(2)静态重编译：正在研究过程中，难度很大,动态代码转换技术,采用动态二进制转换技术实现与X86等处理机兼容，把X86等通用处理机的程序直接映射到VLIW处理机中执行。IBM公司推出了开放源代码DAISY，它不仅可以实现IBM的VLIW处理器与X86处理机之间的二进制兼容，还可以实现PowerPC、S/390、IBM的Java虚拟机与VLIW处理器之间的二进制

34、兼容Transmeta公司推出了“Code Morphing Software”，这种软件可以保证Transmeta公司的VLIW处理机Crusoe能够与X86处理机之间实现二进制代码兼容,计算机系统设计过程,方法1：由上向下（Top-Down）设计过程：由上向下面向应用的数学模型面向应用的高级语言面向这种应用的操作系统面向操作系统和高级语言的机器语言面向机器语言的微指令系统和硬件实现应用场合：专用计算机的设计特点：对于所面向的应用领域，性能和性能价格比很高。随着通用计算机价格降低，目前已经很少采用,方法2：由下向上（Bottom-Up)设计过程：根据当时的器件水平，设计微程序机器级

35、和传统机器级根据不同的应用领域设计多种操作系统、汇编语言、高级语言编译器等最后设计面向应用的用户级。应用场合：通用计算机的一种设计方法，在计算机早期设计中（6070年代）广为采用。特点：容易使软件和硬件脱节，整个计算机系统的效率降低。,方法3：中间开始（Middle-Out)用于系列计算机的设计过程中,方法3：中间开始（Middle-Out)设计过程：首先定义软硬件的分界面(指令系统、存储系统、输入输出系统、中断系统、硬件对操作系统和编译系统的支持等)然后各个层次分别进行设计(软件设计人员设计操作系统、高级语言、汇编语言、应用程序等，硬件设计人员设计传统机器、微程序、硬联逻辑等)应用场合：用于

36、系列机的设计特点：软硬件人员结合、同时设计，软硬件功能分配合理。,计算机系统的发展,1 冯诺依曼结构2 器件发展的影响3 应用发展的影响4 改进算法的影响,冯诺依曼结构,Van Nenmann基本思想于1936年1946年期间形成，由冯诺依曼等人于1946年提出,1.特点:存储程序、运算器为中心、集中控制存储器是字长固定的、顺序线性编址的一维结构，每个地址是唯一定义的。4096个字、40位。由指令形式的低级机器语言驱动。指令顺序执行，即一般按照指令在存储器中存放的顺序执行，程序分支由转移指令实现。运算器为中心，输入输出设备与存储器之间的数据传送都途经运算器。运算器、存储器、输入输出设备的操作

37、以及它们之间的联系都由控制器集中控制。,2.现代处理机对冯诺依曼结构的改进不变的：存储程序改变的：存储器为中心,总线结构,分散控制从基于串行算法变为适应并行算法，出现了向量计算机，并行计算机、多处理机等。流水线处理机，超标量处理机，超流水线处理机，超标量超流水线处理机。数据库计算机和知识库计算机。专用计算机，如FFT变换机、过程控制计算机。为获得高可靠性而研制容错计算机。功能分散化、专业化，出现了各种分布计算机、外围处理机、通信处理机等。,存储器为中心、分散控制,总线结构，分散控制总线：连接计算机各功能部件的连线和管理信息传输规则的逻辑电路称为总线。特点：在任何时刻，只能有一个部件向总线上

38、发送信息，可以有多个部件同时接收信息。组成：数据总线、地址总线、控制总线。单总线结构,双总线结构,三总线结构,3.非冯计算机的发展什么是非冯计算机？非指令驱动，（1）从传统的指令驱动型改变为数据驱动型，出现了数据流机计算机。（2）从传统的指令驱动型改变为需求驱动型，出现各种图归约计算机。（3）处理非数值化信息的智能计算机，自然语言、声音、图形和图象处理,虚拟现实处理等（4）第五代计算机，由推理机和知识库机等组成。历经10年，召开过多次专题国际会议。神经网络计算机，仿生计算机，,2 器件发展的影响,1.第1代至第4代计算机以器件来划分第一代：电子管(Valve)第二代：晶体管(Transist

39、or)第三代：集成电路(LSI)第四代：大规模集成电路(VLSI)第五代：智能计算机？第五代计算机以什么作为标志来划分？第五代计算机什么时候诞生？,2.器件发展的特点集成度迅速提高目前水平：每个芯片有1010个晶体管单芯片内可以做大于1Gb存储器，单芯片内可以集成2个CPU全部Cache 每45年提高一个数量级还没有达到集成度的极限问题？如何利用器件集成度的提高，不断改进计算机系统的性能：例如，有更多指令并行执行，采用更深的流水线，集成更多的Cache等,(2)提高速度空间不大目前CPU主频已经到达6GHz，时钟周期0.16ns，门延迟小于0.01ns 极限速度30万公里/秒/21

40、.5mm/0.01ns 信号在导体中传递速度小于光速的50。Pentium芯片面积500mm2，即23mm 23mm 器件速度提高的余地已经很小，将来提高处理机速度更多依靠系统结构的发展可从系统结构的两个方面提高处理机速度：提高IPC(Internet Process Connection)，从目前的2左右提高到8以上，采用更深度的流水线和并行处理技术,(3)价格直线下降 CPU芯片的价格每年要下降80%(4)可靠性越来越高芯片可靠性达到108小时，连续使用1万年,4.器件发展对计算机组成技术的影响器件速度与处理机工作主频 1955年第一台大型机 IBM704 机，主频12us1976年

41、巨型向量计算机CRAY，主频12.5ns，目前，Pentium4 的主频已经达到 3GHz 器件速度与指令执行时间 46年来器件速度提高104，指令速度快108以上系统结构和组成技术的作用器件速度提高减慢,处理机主频提高速度减缓指令执行速度的提高基本保持不变(摩尔定理),计算机系统的分类,1 按处理机性能分类2 佛林分类法3 库克分类法4 冯泽云分类法5 汉德勒分类法,1 按处理机性能分类,1.按大小划分种类：巨型、大型、中型、小型、微型机划分原则：以性能为特征，按价格来划分存在问题：划分的标准是随时间而变化，每年左右降低一个等级设计方法：最高性能特殊用途最佳性能价格比一般商用计算

42、机最低价格家用计算机等 Small is fast,2.按用途划分种类：科学计算、事务处理、实时控制、工作站、服务器、家用计算机等。划分原则：科学计算：浮点计算速度。事务处理：字符处理、十进制运算。实时控制：中断响应速度、I/0能力。工作站：图形处理能力。服务器：数据处理速度，数据存储能力。家用计算机：价格便宜，软件丰富。发展方向：具备上述所有功能的通用处理机。各种专用处理机、协处理器、嵌入式处理机。,3.按数据类型划分定点计算机、浮点计算机、向量计算机、堆栈计算机等。4.按处理机个数和种类划分单处理机。并行处理机、多处理机、分布处理机。关联处理机。超标量处理机,超流水线处理机,VLIW处

43、理机SMP(对称多处理机)、MPP(大规模并行处理机)、机群(Cluster)系统等。,5.按所使用的器件划分按使用的器件划分计算机系统的时代第一代：电子管(Valve)计算机第二代：晶体管(Transistor)计算机第三代：集成电路(LSI)计算机第四代：大规模集成电路(VLSI)计算机第五代：智能计算机？目前的绝大部分计算机系统是VLSI计算机公认的第五代计算机什么时候诞生？第五代计算机以什么作为标志来划分？,2 佛林分类法,1966年由Michael.J.Flynn 提出按照指令流和数据流的多倍性特征进行分类。指令流：机器执行的指令序列。数据流：由指令流调用的数据序列。

44、多倍性(multiplicity)：在系统性能瓶颈部件上同时处于同一执行阶段的指令或数据的最大可能个数。四种类型(1)单指令流单数据流 SISD(Single Instruction Single Datastream)(2)单指令流多数据流 SIMD(Single Instruction Multiple Datastream)(3)多指令流单数据流 MISD(Multiple Instruction Single Datastream)(4)多指令流多数据流 MIMS(Multiple Instruction Multiple Datastream),(1)SISD 典型单处理机，包括：单

45、功能部件处理机：IBM1401，VAX-11。多功能部件处理机：IBM360/91，370/168，CDC6600等。流水线处理机，指标量流水线处理机。,(2)SIMD：并行处理机、阵列处理机、向量处理机、相联处理机、超标量处理机、超流水线处理机。多个PU按一定方式互连，在同一个CU控制下，对各自的数据完成同一条指令规定的操作；从CU看指令顺序执行，从PU看数据并行执行。,(3)MISD：几条指令对同一个数据进行不同的处理，实际上不存在。,(4)MIMD 多处理机系统，包括：紧密偶合：IBM3081、IBM3084、UNIVAC-1100/80 松散偶合：D-825,Cmmp,CRAY-2,F

46、lynn分类法得到广泛应用 SIMD、MIMD、SPMD、XIMD、主要缺点：(1)分类太粗在SIMD中包括有多种处理机对流水线处理机的划分不明确，标量流水线为SISD，向量流水线为SIMD。(2)根本问题是把两个不同等级的功能并列对待数据流受指令流控制，造成MISD不存在。(3)非冯计算机的分类？其他新型计算机的分类。,3 库克分类法,1978年由 D.J.Kuck提出按控制流和执行流分类，四种类型。(1)单指令流单执行流 SISE(Single Instruction Single Executionstream)典型的单处理机。(2)单指令流多执行流 SIME(Single In

47、struction Multiple Executionstream)多功能部件处理机、相联处理机、向量处理机、流水线处理机、超流水线处理机、超标量处理机、SIMD并行处理机。,(3)多指令流单执行流MISE(Multiple Instruction Single Executionstream)多道程序系统(4)多指令流多执行流MIME(Multiple Instruction Multiple Executionstream)典型的多处理机主要缺点有些系统，如分布处理机等，没有总控制器分类级别太低，没有处理机级和机器级分类太粗，如SIME中包含了多种处理机,4 冯泽云分类法,19

48、72年美籍华人冯泽云提出，用最大并行度Pm对计算机系统体系结构进行分类。最大并行度Pm定义为计算机系统在单位时间内所能处理的最大二进制位数。设每一个时钟周期ti内能处理的二进制位数为Pi，则T个时钟周期内平均并行度，单位时间内能处理的最大二进制位数。例如：同时处理的字宽为n，位宽为m，则最大并行度定义为：Pm m 平均并行度：假设每个时钟周期 ti 内能同时处理的二进位数为Bi，则n个时钟周期内的平均并行度为：表示方法：处理机名(m，),(1)字串位串WSBS(Word Serial and Bit Serial)串行计算机；m1,1；如：EDVAC(1,1)。(2)字并位串WPBS(Word

49、 Parallel and Bit Serial)传统单处理机；m1,1；如：Pentium(32,1)。(3)字串位并WSBP(Word Serial and Bit Parallel)并行计算机、MPP、相联计算机；m 1,1；如：MPP(1,16384),STARAN(1,256)，DAP。(4)字并位并WPBP(Word Parallel and Bit Parallel)全并行计算机；m 1,1；如：ASC(64,32)，IILIAC IV(64,64),PEPE(32,288)，Cmmp(16,16)。主要缺点：仅考虑数据并行，没有考虑指令,任务,作业的并行。,5 汉德勒分类法,由Wolfgan Handler于1977年提出,又称 ESC(Erlange Classification Scheme)分类法。根据并行度和流水线分类把计算机硬件结构分成三个层次，并分别考虑它们的可并行性和流水处理程度。(1)程序级k：程序控制部件(PCU)的个数；(2)操作级d：算术逻辑部件(ALU)或处理部件（PU）的个数；(3)逻辑级w：每个算术逻辑部件包含的逻辑线路(ELC)的套数。,本章重点：,1.计算机系统的层次结构2.计算机系统结构的定义及研究内容3.计算机系统的评价方法4.冯诺依曼结构及其发展5.了解透明性、系列机、兼容性等概念6.了解计算机系统的分类方法,