计算机系统结构第1章教材课件.ppt
《计算机系统结构第1章教材课件.ppt》由会员分享,可在线阅读,更多相关《计算机系统结构第1章教材课件.ppt(81页珍藏版)》请在三一办公上搜索。
1、计算机系统结构 Computer Architecture,研究内容 从外部来研究计算机系统 使用者所看到的物理计算机的抽象 编写出能够在机器上正确运行的程序所必须了解到的计算机属性,学习目的建立计算机系统的完整概念学习计算机系统的分析方法和设计方法了解计算机系统的最新研究成果,第一章 基本概念,介绍计算机系统结构的一些基本知识。包括定性知识和定量知识两大内容。 定性知识:本课程经常使用的一些名词概念,以及对计算机的定性认识、分析方法。 定量知识:对计算机性能进行定量评价的几个重要公式。,计算机发展的五个阶段1、19451954:电子管、继电器,定点运算、机器/汇编语言2、19551964:分
2、立式晶体管、铁磁心存储器、单层PCB,变址寄存器,浮点运算,高级语言批处理监控;3、19651974:SSI、MSI,多层PCB,微程序控制,Cache,多道程序并行,分时OS,IBM360/370;4、19751990:LSI、VLSI,半导体存储器,并行处理,分布处理;5、1991 :VLSI,ULSI,大规模并行处理,推动计算机性能提高的两个关键因素:组成器件:电子管晶体管集成电路系统结构的改进,第一台电子计算机:ENIAC,ENIAC的总成本为48万6千8百美元。它是一个有18000多只电子管,7200只晶体二极管,10000多只电容,7000多只电阻,5万多个焊点,长30.48米,宽
3、1米,占地面积约170平方米,30个操作台,约相当于10间普通房间的大小,重达30吨,消耗功率150kW。,透视计算机的心脏CPU,Intel 的第一块CPU4004,4004,Intel最早的CPU,集成有2,250个晶体管,晶体管之间的距离是10微米(即10000纳米),主频0.74MHz。,1.1.1 计算机系统的多级层次模型,1.1 计算机系统结构,1.1.2 计算机系统结构定义 计算机软件硬件两种定义:定义1:Amdahl于1964年提出:程序员所看到的计算机系统属性,即概念性结构和功能特性看到的:编写出能在机器上正确运行的程序所必须 了解到的。,概念结构,IOP:IO控制器,功能特
4、性:指令系统及其执行模式数据表示:硬件能够直接认别和处理的数据类型和格式;寻址方式:最小寻址单位、寻址方式的种类和地址运算等;寄存器组织:操作数寄存器、变址寄存器、控制寄存器及专用寄存器的定义、数量和使用规则等;指令系统:机器指令的操作类型、格式,指令间的排序和控制机制;,中断系统:中断类型、中断级别和中断响应方式等;存储系统:最小编址单位、编址方式、主存容量、最大寻址空间等;输入输出系统:连接方式、数据交换方式、数据交换过程的控制等;信息保护: 信息保护方式和硬件对信息保护的支持等。,透明性概念 本来存在的事物或属性,从某种角度看似乎不存在例如:浮点数表示、乘法指令 对高级语言程序员、应用程
5、序员透明 对汇编语言程序员、机器语言程序员不透明例如:数据总线宽度、微程序 对汇编语言程序员、机器语言程序员透明 对硬件设计者、计算机维修人员不透明透明度越高,编程越简单,执行效率降低透明度越低,编程越复杂,执行效率提高,定义2: 计算机系统结构主要研究软硬件功能分配和对软硬件界面的确定计算机系统由软件、硬件和固件组成,它们在功能上是同等的。同一种功能可以用硬件实现,也可以用软件或固件实现。系列计算机概念:相同系统结构,不同组成和实现的一系列计算机系统。,1.1.3 计算机组成 计算机组成指计算机系统结构的逻辑实现,主要包括:确定数据通路的宽度确定各种操作对功能部件的共享程度确定专用的功能部件
6、确定功能部件的并行度设计缓冲和排队策略设计控制机构确定采用何种可靠性技术,1.1.4 计算机实现 计算机实现是指计算机组成的物理实现,包括:处理机、主存储器等部件的物理结构器件的集成度和速度专用器件的设计器件、模块、插件、底版的划分与连接信号传输技术电源、冷却及装配技术,相关制造工艺及技术等,计算机系统结构、计算机组成和计算机实现之间的关系:系统结构组成实现,组成和实现的改进推动系统结构的进步;随着技术、器件和应用的发展,三者间界限越来越模糊。,1.2.1 性能评测的常用方法 1.2.2 其他性能1.2.3 价格标准,1.2 计算机系统的评价标准,1.2.1 性能评测的常用方法 以运算速度为主
7、1、时钟频率(主频):如:只表示CPU的指令处理能力实际运算速度还与Cache、内存、I/O、被执行程序等均有关,2、指令执行速度一种经典的表示运算速度的方法MIPS(Million Instructions Per Second)以及 KIPS、GIPS、TIPS其中:Fz为处理机的工作主频 CPI(Cycles Per Instruction)为 每条指令所需的平均时钟周期数 IPC为每个时钟周期平均执行的指令条数,MFLOPS、GFLOPS、 TFLOPS,例1:计算PentiumII 450处理机的运算速度。解:由于PentiumII 450处理机的IPC2(或CPI0.5),Fz45
8、0MHz (1)不同指令的速度差别很大(2)指令使用频度差别很大,主要优点:直观、方便。目前还经常使用 主要缺点:,3、等效指令速度:吉普森(Gibson)法其中:Wi:指令使用频度,i:指令种类静态指令使用频度:在程序中直接统计动态指令使用频度:在程序执行过程中统计在计算机发展的早期,用加法指令的运算速度来衡量计算机的速度。通常:加、减法50,乘法15,除法5,程序控制15,其他15,例2:我国最早研制的小型计算机DJS-130,定点16位,加法速度每秒50万次,但没有硬件乘法和除法等指令。用软件实现乘法和除法,速度降低100倍左右,求定点等效速度。解:即每秒2万次,由于乘法和除法用软件实现
9、,等效速度降低了25倍。,例3:如果浮点开平方操作FPSQR的比例为2%,CPI为100,其他浮点操作的比例为23%,CPI4.0,其余指令的CPI1.33,计算该处理机的等效CPI。如果FPSQR操作的CPI也为4.0,重新计算等效CPI。解: 等效CPI1100 2 4 23 1.33 753.92 等效CPI24 251.33 752.00 由于改进了仅占2的FPSQR操作的CPI,使等效速度提高了近一倍,4、数据处理速率PDR(processing data rate) PDRL/R其中:L0.85G0.15H0.4J0.15K;R0.85M0.09N0.06P其中:G是每条定点指令的
10、位数M是平均定点加法时间H是每条浮点指令的位数N是平均浮点加法时间J是定点操作数的位数P是平均浮点乘法时间K是浮点操作数的位数,5、核心程序法 把应用程序中用的最频繁那部分核心程序作为评价计算机性能的标准程序。称为基准程序benchmark 整数测试程序:Dhrystone, 浮点测试程序:Linpack用FORTRAN语言编写,主要是浮点加法和浮点乘法操作。用MFLOPS(Million Floating Point Operations Per Second)表示GFLOPS、TFLOPS Whetstone基准测试程序,6、基准测试程序套件(SPEC基准程序 )SPEC:System p
11、erformance evaluation Cooperative目前使用最为广泛、最具权威性的测试规矩www.spec.org 由约30个世界知名计算机大厂商所支持的非盈利合作组织,包括:IBM、AT&T、BULL、Compaq、CDC、DG、DEC、Fujitsu、HP、Intel、MIPS、Motolola、SGI、SUN、Unisys等;SPEC能够全面反映机器的性能,具有很高的参考价值;,1.2.2 其他性能1存储能力存储容量,速度,编址单位,编址方式,寻址方式2字长 关键问题:指令字长与数据字长的协调原因:程序与数据共用同一个主存储器早期:由指令字长决定当前:由数据字长决定,8的倍
12、数,如:32位、64位等可变字长:任意组合,3数据类型目前常用:定点、浮点、逻辑、已有类型:向量、串、栈、树、发展方向:自定义数据表示4、指令系统CISC:复杂指令集计算机RISC:精简指令集计算机 VLIW:超长指令字(Very Long Instruction Word),5、输入输出能力输入输出方式中断系统输入输出接口6、兼容性共分12级:011,0级为完全不兼容,11级为自身7、保护和诊断能力程序与数据的保护诊断能力:检错、纠错、冗余、自诊断能力可靠性:RAS技术,可靠性R、可用性A、可维护性S,1.2.3 价格标准1价格与性能的关系:摩尔定理:每隔3 年芯片的集成度翻两翻 用同样的价
13、格,五年之后能买到性能高十倍的机器 计算机系统每年的折旧率为75左右2硬件与软件的价格比例: 硬件的比例下降,软件的比例上升 目前软件价格已经超过硬件价格,微电子发展的神奇规律Moores Law,软件所占的成本越来越高,1.3 计算机系统的设计技术,1.3.1 几个定量原理 1.3.2 软硬件取舍1.3.3 软件兼容性1.3.4 计算机系统设计方法,1、Amdahl定律(加快经常性事件原理),其中:Sn 全局加速比; To 原执行时间(old); Tn 新执行时间(new); Se 被改进部分的局部加速比; Fe 被改进部分原执行时间占原来总时间的百分比。,1.3.1 几个定量原理,性能改善
14、的极限值受Fe值限制。,例4:假设将某一部件的处理速度加快到10倍,该部件的原处理时间为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少?,解: 由题意可知:Fe=0.4, Se=10,根据Amdahl定律,,2、 CPI与程序执行时间Te CPI是衡量CPU执行指令效率的重要指标。,3、 存储器访问的局部性原理实质:根据程序运行的最近情况,可以较为精确的预测出最近的将来将要访问哪些指令和数据。,访问的局部性原理是构成层次化存储系统的理论基础。,时间局部性:最近访问过的代码在很短的时间内有可能被再次访问;主要对应于循环语句;,空间局部性:与刚被访问过的指令或数据相邻的指令或数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机系统 结构 教材 课件

链接地址:https://www.31ppt.com/p-1547890.html