计算机组成与结构PPT课件(全)第11章计算机系统.ppt
《计算机组成与结构PPT课件(全)第11章计算机系统.ppt》由会员分享,可在线阅读,更多相关《计算机组成与结构PPT课件(全)第11章计算机系统.ppt(177页珍藏版)》请在三一办公上搜索。
1、第11章 计算机系统,11.1 计算机系统概述11.2 微机系统11.3 工作站和服务器11.4 多媒体计算机11.5 超级标量处理机、超级流水线处理机和超长指令字处理机,11.6 向量处理机11.7 阵列处理机和多处理机系统11.8 计算机网络习题,11.1 计算机系统概述11.1.1 计算机系统的分类随着计算机系统结构的发展,出现了各种复杂程度不同,运算速度、处理能力各异的计算机系统,同时也出现了对计算机系统进行分类的各种方法。目前常用的是1966年弗林根据指令流和数据流数量进行分类的方法。其中指令流是机器执行的指令序列,数据流是由指令流调用的数据序列。可将计算机系统分成下列四类。,1.单
2、指令流单数据流(SISD)计算机系统通常由一个处理器和一个存储器组成。典型的 SISD 计算机每次执行一条指令,每次从存储器取(或存)一个数据,为了提高运算速度,有些 SISD 计算机设置了指令流水线和运算操作流水线,有些还设置了多个功能部件和多体交叉存储器。,2.单指令流多数据流(SIMD)计算机系统通常由一个指令控制部件、多个处理器和多个存储器组成。各处理器和各存储器之间通过互联网络进行通信。在程序运行时由指令控制部件向各个处理器“播送”同一条指令,所有“活动的”处理器在同一时刻执行同样的指令,这就是单指令流(各处理器可由程序分别设置成“活动的”或“不活动的”,“不活动的”处理器不执行指令
3、规定的操作);各“活动的”处理器执行指令时所需的数据是从它本身专用的存储器中取的,所以各处理器所处理的数据是各不相同的,这就是多数据流。为各个处理器所专用的存储器又叫局部存储器。,3.多指令流单数据流(MISD)计算机系统MISD 计算机系统在同一时刻执行多条指令,但处理同一个数据。大多数人认为能列在这一系统中的计算机很少或根本不存在。4.多指令流多数据流(MIMD)计算机系统典型的 MIMD 计算机系统由多台处理器(包括指令控制部件和处理器)和多个存储器组成,并有一个互联网络实现各处理器和各存储器之间的通信。每台处理器执行各自的指令,存取各自的数据(各不相同)。,11.1.2 提高计算机系统
4、运算速度的方法提高计算机系统的运算速度的方法可归纳为两种:(1)改进器件工艺,减少芯片线宽,提高集成度与工作频率。(2)改进计算机系统结构,并使各部件之间的速度匹配。针对单机系统已介绍过改进系统结构的方法有:(1)采用多个通用寄存器来暂存运算的中间结果,以减少访问存储器次数。,(2)采用多体交叉存储器和cache,以协调CPU和存储器之间的速度匹配。(3)CPU 和输入输出设备并行工作,以减少 CPU 等待和空闲时间。(4)操作重叠的流水线工作方式。这些方法开始都用在大型计算机上,现已推广到中、小型机甚至微机上。在本章中,我们将介绍多种计算机系统,其发展的最终目的是增强计算机处理能力和提高运算
5、速度。,11.1.3 开放系统1.专有系统与开放系统(1)专有系统。硬件和软件都由一家公司提供,并不向外提供技术,从历史上看,一些有名的大计算机公司,如 IBM、DEC 都是靠独家专利的计算机发迹的。(2)开放系统。硬件和软件可由多家公司提供,计算机系统的所有部分,如计算机体系结构、系统总线、操作系统、窗口系统、数据库、图形用户接口、计算机网络和通信服务等都是开放的,符合与制造商无关的国际标准。这样厂商之间很容易进行分工,用户可以选用市场上最好的、适合应用的软件、硬件组成计算机系统或信息系统。,2.开放系统的特点(1)遵循标准接口,使得计算机系统之间有“可移植性”和“互操作性”。可移植性是指将
6、操作系统或应用软件放在不同厂家的各种不同型号的计算机上使用。互操作性是指不同厂家在不同平台上开发的多种应用软件具有共享数据和协同工作的能力。(2)开放系统可由制造商、增值转销商或最终用户从不同公司购买设备进行扩充或升级,并能保护他们在软件上的投资(即原有软件仍能运行)。,(3)有大量第三方软件公司或用户的软件产品可在开放系统上运行。(4)开放接口应有一个公开的技术规格说明,即标准,有国际标准、国家标准及事实上的标准(工业标准),前面二种标准应经相应的标准化组织通过,而工业标准是由于产品的巨大销量而成为实际的标准。,11.1.4 计算机系统的性能评测1.评测性能的几种方法计算机的时钟频率在一定程
7、度上反映了机器速度,一般来讲,主频越高,速度越快,但是相同频率,不同体系结构的机器,其速度可能会相差很多倍,因此还需要有其他方法来测试速度。早期的计算机速度是通过计算得来的,当时根据各类指令的执行频率按一定的比例估算,得到平均运算速度。这种方法很不精确,因为在不同程序中,不同指令的使用频率是不同的,而且数据长度、指令系统功能、cache、流水线等与机器的性能有很大关系,在计算时不能得到充分反映。,另外有一种通过“计算处理速率”(processing data rate,简称PDR)值的方法来衡量机器性能。PDR 值大机器性能好。PDR 是指令操作数的平均位数和指令平均速度的比值(加权)、其计算
8、公式如下:PDRLRL0.85G0.15H0.4J0.15KR0.85M0.09N0.06P式中:G是每条定点指令的位数;M是定点加法平均时间;H是每条浮点指令的位数;N是浮点加法平均时间;,J是定点操作数的位数;P是浮点乘法平均时间。K是浮点操作数的位数;PDR 值主要对 CPU 和主存储器的速度进行度量,与真正的机器运行速度有不少差别,它曾是美国政府确定计算机出口许可证的限制性指标。等效乘法速率(equivalent multiply rate,简称EMR)曾是美国政府确定计算机出口许可证浮点性能的限制性指标。核心程序法是把程序中应用得最频繁的那部分核心程序作为评价计算机性能的标准程序。但
9、因程序短,以致访存的局部性大,cache 命中率偏高。,基准程序法(benchmark)是目前一致承认的较好的测试方法。在下面我们将讲到各种基准测试程序,测试的结果:通常整数性能用 MIPS(百万次整数运算指令秒)、浮点性能用 MFLOPS(百万次浮点运算指令秒)等表示。通常将 VAX11780 的运算速度定为1 MIPS。2.基准测试程序基准测试程序往往是为了测试计算机系统某一部分性能而人为地选择一些典型指令组成的,也可能是从实际的应用程序中选择一部分作为测试程序。常用的有:,(1)整数测试程序Dhrystone 基准测试程序主要用于测试编译器和 CPU 处理整数指令和控制功能的有效性。当今
10、已很少使用。(2)浮点测试程序Linpack 基准测试程序是一组求解密集线性代数方程组的程序包,初创于70年代,在以后的20多年中不断完善和更新,至今仍是计算机性能测试的主要标准之一。Whetstone 基准测试程序主要由执行浮点运算、整数算术运算、功能调用、数组变址、条件转移和超越函数的程序组成。当今已很少使用。,(3)计算机综合测试程序 SPEC随着计算机技术的飞速发展,厂商和用户都希望有一个标准、客观和公正的评测工具。在此背景下,一个非营利性组织美国标准性能评价协会(Standard Performance Evaluation Corporation,简称SPEC)于1988年成立。S
11、PEC发表的第一组标准化测试程序是SPEC 89,后来在1992年和1995年相继推出了SPEC 92和SPEC 95,并取代了老的版本。SPEC的基准测试程序全部选自实际的应用程序。以下讨论SPEC 95测试程序。,SPEC 95由两组基准程序组成:SPEC CINT 95用C语言写成的整数/非浮点计算基准程序。由8个基准程序组成。SPEC CFP 95用FORTRAN语言写成的浮点计算基准程序。由10个基准程序组成。SPEC 95重点测试计算机的处理器、存储结构和编译器的性能,对I/O、网络和图形部件的测试未加考虑。,SPEC组织采用SUN SPARC Station 10/40工作站作为
12、SPEC 95的参考机(SPEC 89和SPEC 92的参考机为VAX-11/780),CINT 95和CFP 95两组基准程序在参考机上大约需要运行48小时。每个基准程序经参考机的运行和测试得到相应的参考时间,将用于被测试机器的SPEC 95性能指标的计算。SPEC规定在SPEC 95参考机上测试每个基准程序的得分为1,在被测机进行SPEC 95测试时,CINT 95和CFP 95中的每个基准程序单独计算得分,然后再用这些得分计算各项合成指标(取几何平均值)。假定被测计算机系统的得分为10,则表示该系统的相应能力是参考机的10倍。,SPEC 95的主流版本是用于UNIX操作系统的版本。为了保
13、证测试结果的公正性和可比性,所有的测试必须在SPEC提供的工具环境中完成,包括配置文件的生成、程序的编译、运行环境的建立和实施、测试报告结果的生成等。整个测试是在严格的规则下自动完成的,绝对禁止任何手工干预。SPEC 95和SPEC 92的基准程序、运行规则和使用的SPEC工具等都不相同,因此无法提供这两类测试结果指标之间的相互转换关系。,事务处理性能测试委员会(Transaction Process performance Council,简称TPC)是一个专门负责制定计算机事务处理能力测试标准并监督其执行的组织。20世纪80年代初出现了一种新的在线计算模式,它通过在线数据库系统进行简单的事
14、务处理,拥有良好的在线事务处理(online transaction process,简称OLTP)系统的厂家就可以赢得更多的客户;因此制定有关的测试标准就提到日程上来了。TPC于1988年成立,1989年发布了其成立后的第一个标准:TPC-A。,20世纪90年代,TPC又发表了两个新的标准:OLTP测试标准TPC-C和决策支持系统测试标准TPC-D。这两个标准在各自领域内得到承认,但是随着系统能力的增加,新的TPC-C和TPC-D计划在1999年发布。1998年,TPC发布了新的基于Web商业的测试标准TPC-W,用来测试一些通过Internet进行的商业行为,如零售店、机票预定等。事务吞吐
15、量(每分钟可完成多少个任务)和性能价格比是TPC的两个重要测试指标。,(5)行业基准测试国内外一些重要行业,如核能、航天、气象、石油行业等,深感通用基准测试程序的不足,他们根据自己行业应用的特点而开发了一批基准测试程序,其成功者,再逐步推广到其他行业,成为公共的基准测试程序。3.基准测试的公正性和准确性所有基准测试组织都是中立的,一般是非赢利的。测试结果一般来说是公正的,但是外界的干扰可能会冲击基准测试的公正性。,测试结果是否能准确反映计算机实际使用的效果,这就是准确性问题。计算机系统性能是软硬件有机结合的整体的综合性能,而基准测试则是由若干个局部测试程序组成的,不能全面反映综合性能,尤其是尚
16、未解决如何检测系统的瓶颈问题;再加上厂家大肆宣传对其有利的测试结果,而掩盖其缺点,因此对基准测试的结果也不能迷信。另外有些重要性能,如系统的可靠性、可用性和可维护性很难测试。因此基准测试所获得的局部结论是基本可信的,但不足以准确反映实际使用效果。,11.2 微机系统11.2.1 Intel微处理器及个人计算机Intel微处理器及个人计算机20世纪80年代微机的兴起促进了计算机的大普及。微机的核心是微处理器。当前世界上影响最大的半导体器件生产厂家是 Intel 公司。微处理器沿着增加字长、提高主频、提高集成度的方向发展。表11.1列出了Intel微处理器芯片的有关参数。,表11.1 Intel微
17、处理器性能,表11.1中列出的8086是同一系列的微处理器,其时钟频率(主频)已从8086的5MHz提高到P的450MHz,集成度从2.9万个管子发展到750万个管子,相应的工艺(线宽)从3m减少到0.25m。但是以上的指标反映的是芯片的性能,还不能完全代表微机系统的性能,影响系统性能的还有微处理器与内存之间的总线速度,地址总线宽度,数据总线宽度,芯片内部是否设置浮点协处理器,是否设置cache(一级和二级)等。,(1)内存总线速度开始时芯片内部的时钟频率与总线频率一致,后来出现了倍频技术,使内部时钟频率可以高于总线频率。(2)地址总线宽度确定了处理器可访问的内存容量,其宽度已从20位(支持1
18、MB容量)发展到64位。(3)数据总线宽度表11.1中列出的内部数据宽度是指处理器芯片内部传送数据的总线宽度,外部数据宽度是指处理器与内存(或I/O接口)之间交换数据的宽度。,(4)浮点处理器(5)cache存储器随着微机主频和集成度的提高,在片内设置cache具有必要性和可能性,而且更进一步从一级cache(L1)发展到两级cache(L1和L2)。个别的甚至发展到三级cache(Alpha 21164)。在80486微处理器中,内置有代码(程序)和数据共用的容量为8KB/16KB的L1 cache。而在Pentium微处理器中,使用了两个容量各为8KB的L1 cache,一个用于代码,一个
19、用于数据。,Pentium Pro进一步将CPU和L2 cache封装在一起(容量为256KB或512KB),并且让L2 cache通过专用总线(64位宽)以主频速度与微处理器中的CPU进行通信(图11.1),提高了微处理器性能,并解决了外部数据总线(系统总线)带宽受限的瓶颈问题。(6)MMX技术新的通信、游戏、娱乐和教育等应用要求PC具有视频、3D图形、动画、音频等多媒体功能,Pentium MMX将多媒体扩展(MultiMedia eXtention,简称MMX)技术结合到Pentium芯片中,具有以下特点:,图11.1 双重独立总线(5)cache存储器,增加了4种数据类型,即紧缩字节(
20、8位位)、紧缩字(4位16位)、紧缩双字(2位32位)和紧缩4字(1位64位)。其目的是紧缩组合定点整数,将多个整数字组成一个64位数据,用一条指令对64位数据进行处理。增加了8个64位MMX寄存器。增加了57条指令,用来完成音频、视频图形图像处理等。它涉及的操作有:算术操作、比较操作、逻辑操作、新数据类型之间的转换(紧缩数据及解压),MMX寄存器之间的数据传送(MOV)等。,(7)Pentium(P)P是Pentium Pro级的MMX处理器。具有以下特点:双重独立总线。二级cache总线与处理器到内存的系统总线分别独立,缓解了对系统总线带宽的要求。二级cache的容量为512KB。动态执行
21、技术。指令预取,对多分支指令进行预测,按优化顺序执行指令,提高了处理速度。内置MMX技术,增加了57条MMX指令。,新的单边接触式SEC(single edge contact,简称SEC)封装,其插槽被命令为Slot1,并申请了专利,这是Intel为甩掉其竞争对手而采取的措施,在此之前Intel及其他厂商的芯片的引出端都采用网格阵列(pin grid array,简称PGA)封装,其插槽命名为Socket 7。Pentium 将微处理器和L2 cache封装在一个长方形的匣中,其体积虽然很大,但由于采用SEC封装,其外形更像一个插卡而不是集成块,因此在主板上所占的面积比Socket 7小得多
22、。另外P采用了双重独立总线结构,其优点不再重述。,0.25m的P采用Slot 2技术,将L2 cache由512KB提高到2MB,并适用于8处理器多重处理,采用Slot 1技术的P只支持双处理器多重处理。Intel公司于1998年3月推出了一款低价无L2 cache的Pentium 微处理器称为Celeron(中文名为赛扬),这是靠牺牲性能而获得的低价产品,不被业界看好。同年8月,Intel推出了新一代的Celeron处理器,称之为Celeron A或新赛扬。与赛扬相比,新赛扬有以下改进:,内置128KB L2 cache。在CPU芯片内置有L2 cache,这不同于以往的Pentium 处理
23、器。在P的集成电路封装盒内实际上有两片独立的L2 cache芯片分别置于CPU芯片的两边,在片内用线相连;而新赛扬则是将L2 cache与CPU设计在同一芯片中,更有利于提高数据的传输速度。Celeron A的L2 cache能以CPU频率操作,而以往的P cache(L2)只能以CPU频率的二分之一操作。,1999年1月,Intel又发表了其即将推向市场的P处理器。P和P的最大区别是增加了71条指令来提高浮点运算以及其他性能,而且在一个指令周期内可以同时处理4条单精度浮点数据;另外还可以让浮点和MMX的数据同时访问处理器内的寄存器,这些措施大大地提高了P的性能。其他诸如L1 cache和L2
24、 cache的容量等仍与P处理器相同。,1997年10月在每年一度的硅谷“微处理器论坛”上,Intel公司和HP公司向同行们讲述了他们合作开发的最新的高档微处理器Merced的设计技术。他们用显性并行指令计算(explicitly parallel instruction computing,简称EPIC)来描述Merced的设计原理,这种设计使单个Merced能够起到一群处理器的角色,有可能同时处理十几个运算操作。专家们推测其时钟频率可能达到900MHz。Merced可运行在Windows或Unix操作系统环境下,Windows是微软公司为Intel微处理器设计的操作系统,而Unix(HP-
25、UX)是HP公司运行在HP-PA RISC微处理器上的操作系统。,为了保持与Windows程序的兼容性,芯片的一部分包含Pentium微处理器的部分内核;为了保证HP-UX程序能够运行,芯片的另一部分包含PA-RISC电路;Merced的其他部分安放新的EPIC电路,包括一组64位RISC处理单元,这些单元使Merced可以并行运行许多操作。Merced的编译器(将软件开发者编写的程序翻译成机器语言)除了把程序翻译成Merced的指令代码外,还能分析程序,并提取不依赖于其他顺序操作结果的指令构成“独立指令”等。这些指令可以按任意次序运行,并且可以让芯片任何可用的部分执行。再则,Merced已经
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 组成 结构 PPT 课件 11 计算机系统
链接地址:https://www.31ppt.com/p-6023900.html