计算机系统结构简介课件.ppt
《计算机系统结构简介课件.ppt》由会员分享,可在线阅读,更多相关《计算机系统结构简介课件.ppt(110页珍藏版)》请在三一办公上搜索。
1、1.1 计算机系统结构简介,计算机性能,1.提高处理机运算速度:MIPSFz IPC 其中:Fz为处理机的工作主频 IPC(Instruction Per Cycle)为 每个时钟周期平均执行的指令条数。提高IPC:依靠先进系统结构 过去,几个或几十个周期完成一条指令 现在,一个周期完成几条指令。提高Fz:缩短门电路延迟,依靠技术进步 流水线技术等,依靠先进系统结构 从指令串行执行,到P4的20级流水线。,2.计算机性能提高的几个阶段 20世纪70年代末之前,大型机和小型机计算机性能每年提高25%30%。20世纪80年代初,出现微处理机,依靠集成电路技术,性能每年提高35%20世纪80年中期,
2、出现RISC技术、高级语言和操作系统等,性能每年提高50%1995年,先进系统结构对微处理器性能的贡献是单纯技术进步的5倍。3.近几年及将来,计算机性能按摩尔定理发展。4.计算机系统的设计者们要不断创新。,1、虚拟计算机,定义:从不同角度所看到的计算机系统的属性是不同的。虚拟计算机指通过软件模拟的具有完整硬件系统功能的,运行在一个完全隔离环境中的完整计算机系统。主要观察角度包括:应用程序员 系统程序员 硬件设计人员对计算机系统的认识通常只需要在某一个层次上,虚拟计算机系统,2、计算机系统的层次结构,计算机系统可分为7个层次 第3级至第6级由软件实现,称为虚拟机。从学科领域来划分:第0级和第1级
3、属于计算机组成原理;第2级属于计算机系统结构;第3至第5级属于系统软件;第6级属于应用软件;它们之间有交叉 例如:第3级必须依赖第4级和第5级来实现。,计算机系统的层次结构,计算机系统的层次结构,虚拟机:由软件实现的机器。语言实现的两种基本技术 翻译:先把N+1级程序全部变换成N级程序后,再去执行新产生的N级程序,在执行过程中 N+1级程序不再被访问。解释:每当一条N+1级指令被译码后,就直接 去执行一串等效的N级指令,然后再去取下 一条N+1级的指令,依此重复进行。解释执行比翻译花的时间多,但存储空间占用较少。,3、透明性概念,定义:本来存在的事物或属性,从某种角度看似乎不存在。例如:CPU
4、类型、型号、主存储器容量等 对应用程序员 透明 对系统程序员、硬件设计人员等 不透明例如:浮点数表示、乘法指令 对高级语言程序员、应用程序员 透明 对汇编语言程序员、机器语言程序员 不透明例如:数据总线宽度、微程序 对汇编语言程序员、机器语言程序员 透明 对硬件设计人员、计算机维修人员 不透明,深入体会,计算机系统结构的定义,经典的计算机系统结构定义一 C.M.Amdahl于1964年在推出IBM360系列计算机时提出:程序员所看到的计算机系统的属性,即概念性结构和功能特性。通常,低级机器的属性对于高层机器程序员基本是透明的,计算机体系结构主要指机器语言级机器的系统结构。按照计算机系统的多级层
5、次结构,不同级程序员所看到的计算机具有不同的属性。在计算机技术中,对这种本来是存在的事物或属性,但从某种角度看又好象不存在。程序员:系统程序员(包括:汇编语言、机器语言、编译程序、操作系统)。看到的:编写出能在机器上正确运行的程序所必须了解到的。,概念性结构 IBM360系列计算机的概念性结构,功能特性:指令系统及其执行模式,数据表示:硬件能够直接认别和处理的数据类型;寻址技术:编址方式、寻址方式和定位方式等;寄存器组织:操作数寄存器、变址寄存器、控制寄存 器及专用寄存器的定义、数量和使用规等;指令系统:操作类型、格式,指令间的排序控制等;中断系统:中断类型、中断级别和中断响应方式等;存储系统
6、:寻址空间、虚拟存储器、Cache存储等;处理机工作状态:定义和切换方式,如管态和目等;输入输出系统:数据交换方式、交换过程的控制等;信息保护:信息保护方式和硬件对信息保护的支持等。,计算机系统结构定义二,研究软硬件功能分配和对软硬件界面的确定 计算机系统由软件、硬件和固件组成,它们在功能上是同等的。同一种功能可以用硬件实现,也可以用软件或固件实现。不同的组成只是性能和价格不同,他们的系统结构是相同的。系列计算机概念:相同系统结构,不同组成和实现的一系列计算机系统。,程序员所看到的计算机系统的属性,即概念性结构和功能特性。,计算机组成技术,1.课程名称 Computer Organizatio
7、n 计算机组成,计算机组织,计算机原理,计算机组成原理2.研究方法 从内部研究计算机系统 计算机组成是指计算机系统结构的逻辑实现。3.主要研究内容确定数据通路的宽度;确定各种操作对功能部件的共享程度;确定专用的功能部件;确定功能部件的并行度;设计缓冲和排队策略;设计控制机构;确定采用何种可靠性技术。,计算机实现技术,计算机实现是指计算机组成的物理实现。主要包括:处理机、主存储器等部件的物理结构;器件的集成度和速度;专用器件的设计;器件、模块、插件、底版的划分与连接;信号传输技术;电源、冷却及装配技术,制造工艺及技术等。随着技术、器件和应用的发展,它们三者之间的界限越来越模糊。,1.2 计算机系
8、统的评价标准,运算速度是表示处理机性能的主要指标。有多种表示处理机运算速度的方法。哪一种表示方法合理?1.时钟频率(处理机主频)只能用于同一公司、同一类型、同一配置的处理机 如:Pentium4 2.0G比Pentium4 1.6G快25%?Pentium4 2.4G比Pentium4 1.6G快50%?只表示CPU的指令处理能力。实际运算速度还与Cache、内存、I/O、被执行程序等均有关。,2.指令执行速度,一种经典的表示运算速度的方法 MIPS(Million Instructions Per Second),GIPS,TIPS(million,billion,trillion)其中:F
9、z为处理机的工作主频 CPI(Cycles Per Instruction)为 每条指令所需的平均时钟周期数 IPC(Instruction Per Cycle)为 每个时钟周期平均执行的指令条数,例1:计算 Pentium IV 2GHz 处理机的指令执行速度,解:由于 PentiumIV 2GHz 处理机的 IPC4(或CPI0.25),Fz2000MHz 因此,MIPSPentiumIV2GFzIPC20004 8000MIPS8GIPS 即每秒钟80亿次(平均每秒钟执行80亿条指令)主要优点:直观、方便。目前还经常使用 主要缺点:(1)不同指令的执行速度差别很大;(2)指令使用频度差别
10、很大;(3)有相当多的非功能性指令;,3.等效指令速度:吉普森(Gibson)法:加减法50,乘法15,除法5,程序控制15,其他15 静态指令使用频度:在程序中直接统计 动态指令使用频度:在程序执行过程中统计,例2:我国早期研制的一种小型计算机DJS-130定点16位,加法指令每秒50万次,但没有硬件乘除法指令。用软件实现乘除法,速度低100倍左右。求等效指令速度。,解:等效指令速度为:,即每秒2万次,由于用软件实现乘除法,等效指令速度降低了25倍。,例3:假设在一般程序中浮点开平方操作FPSQR所占的比例为2,它的CPI为100;其他浮点操作FP所占的比例为23,它的CPI4.0;其余75
11、指令的CPI1.33,计算该处理机的等效CPI。如果FPSQR操作的CPI也为4.0,重新计算等效CPI。,解:等效CPI110024231.33753.92等效CPI24251.33752.00,改进了在用户程序中仅占2的开平方操作,整个机器的等效运算速度提高了近一倍。,4.指令执行速度的 4 种平均方法 算术平均:调和平均(用速率来度量):加权平均加权算术平均:加权调和平均:,几何平均:其中:n 指不同的程序,ETR(execution time ratio)i是第i个程序相对于参考机器正交化后的执行时间 几何平均速度与所参考的机器无关,有如下性质:几何平均值的比率等于比率的几何平均值,运
12、行程序P1时,A的速度是B的10倍;运行程序P2时,B的速度是A的10倍;运行程序P1时,A的速度是C的20倍;运行程序P2时,C的速度是A的50倍;运行程序P1时,B的速度是C的2倍;运行程序P2时,C的速度是B的5倍。,算术平均:程序P1和P2各执行1次,B的速度是A的9.1倍;程序P1和P2各执行1次,C的速度是A的25倍;程序P1和P2各执行1次,C的速度是B的2.75倍。结论:执行程序P1和P2相同次数,机器A最慢,机器C最快 算术平均速度:三台机器的速度之比为:A:B:C=1:9.1:25,加权算术平均 加权算术平均W1三台机器的速度:A B C加权算术平均W2三台机器的速度:A
13、C B加权算术平均W3三台机器的速度:C B A,几何平均 几何平均值与所参考的机器无关,机器A与机器B的性能相同,机器C的执行时间是机器A或机器B 的0.63倍。执行程序P1和P2的总时间,机器A几乎是机器B的10倍。,5.核心程序法 把应用程序中使用最频繁的那部分程序作为评价计算机性能的标准程序。称为基准测试程序(benchmark)整数测试程序:Dhrystone 用C语言编写,100条语句。包括:各种赋值语句,数据类型和数据区,控制语句,过程调用和参数传送,整数运算和逻辑操作等。VAX-11/780的测试结果为每秒1757个Dhrystones,即:1VAX MIPS1757 Dhry
14、stonesSecond 浮点测试程序:Linpack 用FORTRAN编写,主要是浮点加法和浮点乘法操作 用 MFLOPS(Million Floating Point Operations Per Second)表示,GFLOPS、TFLOPS,SPEC基准程序 System Performance Evaluation Cooperative 由30个左右世界知名计算机大厂商所支持的非盈利性国际合作组织,包括:IBM、AT&T、BULL、Compaq、CDC、DG、DEC、Fujitsu、HP、Intel、MIPS、Motolola、SGI、SUN、Unisys等;1989年10月宣布S
15、PEC1.0,程序量超过15万行,包含4个定点程序和6个浮点程序,测试结果用SPECint89和SPECfp89表示。1992年增加到有6个定点程序和14个浮点程序,测试结果用SPECint92和SPECfp92表示。1995年推出SPECint95和SPECfp95 SPEC2000,12个定点程序、14个浮点程序,SPEC基准测试程序举例,处理机 SPECint95 SPECfp95 PentiumII 450 18.5 13.3 PentiumIII 450 18.7 13.7 PentiumIII 500 20.6 14.7 PientiumIII 550 22.3 15.6 Cele
16、ron 300A 12.0 9.66 Celeron 333 13.1 10.20 Celeron 366 14.1 10.70 Celeron 400 15.1 11.20 Celeron 433 16.1 11.60 Celeron 466 17.0 12.00,Pentium4性能评测数据(数据全部来源于Intel网站),6.峰值速度,峰值指令速度:MIPS、GIPS、TI PS 浮点蜂值速度:MFLOPS、GFLOPS、TFLOPS例5:一个由36台计算机组成的Cluster系统,每 台计算机内部由4个Pentium III 700,计算这个Cluster系统的指令峰值速度。解:Pen
17、tiumIII 700MHz,有3条指令流水线,峰值指令速度为:700 3 2100MIPS Cluster的峰值指令速度700 36 302 400MIPS 即每秒千亿次,存储系统,1.存储层次 第1层:Register Files(寄存器堆)第2层:Lookahead(先行缓冲站)第3层:Cache(高速缓冲存储器)第4层:Main Memory(主存储器)第5层:Online Storage(联机存储器)第6层:Off-line Storage(脱机存储器)第13层在CPU芯片内部,第4层在主板上,第5层在机箱内(硬盘),第6层依靠手工加载(VCD/DVD/磁带/刻录机等),2.寻址空间
18、程序员可以使用的存储器容量,即每个程序的大小 通常有216、224、232、264、Pentium处理机的寻址空间为4GB 与实际配置的存储器容量无关3.存储容量 实际物理存储器的大小 通常用KB、MB、GB等表示 建议配置:主存:128MB512MB 硬盘:40GB137GB,4.主存储器的种类 SDRAM(Synchronous Dynamic Random Access Memory)RDRAM(RAMBUS DRAM)DDR(Dual Date Rate DRAM)5.速度 主存度与CPU系统总线速度相匹配 P4系统总线速度400MHz(3200MB/S)或533 DDR:64bits
19、333MHz/8=2700MB/S RDRAM:16bits800MHz/82=3200MB/S 6.存储系统 采用软件和硬件相结合的方法,获得速度高、容量大、价格便宜的存储器,SDRAM是Synchronous Dynamic Random Access Memory(同步动态随机存储器)的简称,是前几年普遍使用。采用3.3v工作电压,带宽64位,SDRAM将CPU与RAM通过一个相同的时钟锁在一起,使RAM和CPU能够共享一个时钟周期,以相同的速度同步工作。SDRAM基于双存储体结构,内含两个交错的存储阵列,当CPU从一个存储体或阵列访问数据时,另一个就已为读写数据做好了准备,通过这两个存
20、储阵列的紧密切换,读取效率就能得到成倍的提高。SDRAM不仅可用作主存,在显示卡上的显存方面也有广泛应用。DDR SDRAM是Double Data Rate Synchronous Dynamic Random Access Memory(双数据率同步动态随机存储器)的简称,是由VIA等公司为了与RDRAM相抗衡而提出的内存标准。DDR SDRAM是SDRAM的更新换代产品,采用2.5v工作电压,它允许在时钟脉冲的上升沿和下降沿传输数据,这样不需要提高时钟的频率就能加倍提高SDRAM的速度,并具有比SDRAM多一倍的传输速率和内存带宽。,其他性能,1.字长 1几百位,16位、32位、64位
21、由数据字长决定,8的倍数,32位、64位等 可变字长:任意组合2.数据表示 定点、浮点、逻辑、向量、串、栈、树、发展方向之一:自定义数据表示3.指令系统 CISC(Complex Instruction Set Computer)复杂指令集计算机 RISC(Reduced Instruction Set Computer)精简指令集计算机 VLIW(Very Long Instruction Word)超长指令字,4.输入输出系统 输入输出系统的组织方式 中断系统 通道处理机 输入输出处理机5.保护和诊断能力 程序与数据的保护 诊断能力:检错,纠错,冗余,自诊断能力 可靠性:RAS技术,可靠性
22、R,可用性A,可维护性S,价格标准,1价格与性能的关系:摩尔定理:速度每10年左右提高100倍,但价格基本维持不变。用当前同样的价格,在5年之后能买到性能高出10倍的计算机。2硬件与软件的价格比例:硬件在整个计算机系统价格中所占的比例在下降,软件所占的比例在上升。目前软件价格已经超过硬件价格。,软件所占的成本越来越高,计算机系统的设计技术,1、计算机设计者的任务2、软硬件取舍3、软件兼容性4、计算机系统设计方法,一、计算机设计者的任务,系统结构设计:包括指令集、存储系统、总线结构、处理器设计等,是软硬件的分界面。硬件实现技术:相当重要,不同指令集对系统性能的影响在缩小。应用或市场需求性能优化:
23、可靠性、容错性、价格与性能。实现的复杂性:硬件实现方案、软件复杂性、投放市场时间。性能价格比:必须考虑实现的成本,包括软件成本。,二、软硬件取舍,1.软硬件的关系理论上有两种极端实现方法:全硬件机器:操作系统、高级语言、应用等。全软件机器:硬件只有1位加法和分支操作,其他都用软件。关键问题:性能与价格的关系。软件与硬件实现的特点 硬件实现:速度快、成本高;灵活性差、占用内存少。软件实现:速度低、复制费用低;灵活性好、占用内存多。,集成电路的基本制造工艺:1.首先生产圆片(研磨、抛光);2.在圆片上制造出大量电路单元(光刻掩膜版、涂胶、曝光、显影、掺杂技术);3.园片经过测试后按照制造的电路单元
24、被切割成基片;4.基片在外壳中封装好以后就是集成电路成品。,集成电路的圆片和基片,园片成本、园片成品率、值及疵点密度等;由生产工艺决定;基片面积由设计人员控制。,硬件实现的比例越来越高,2.从价格因素考虑的软硬件取舍 假设:硬件设计费为Dh、软件设计费为Ds、硬件拷贝费为Ch、软件拷贝费为Cs,R为软件重复出现次数(占用内存、占用介质),当台数为V时,每台的硬件费用和软件费用之比为:由于:Dh Ds,Ch Cs,当R很大时,经常使用的基本功能适宜用硬件实现 由于:Ds Cs,当V很大时,生产台数很多时适宜用硬件实现,三、从改进性能考虑的软硬件取舍基本方法:加快经常性事件的执行速度。Amdahl



- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机系统 结构 简介 课件

链接地址:https://www.31ppt.com/p-4031402.html