《计算机系统结构》习题课及答案全套.ppt
《《计算机系统结构》习题课及答案全套.ppt》由会员分享,可在线阅读,更多相关《《计算机系统结构》习题课及答案全套.ppt(126页珍藏版)》请在三一办公上搜索。
1、习题课,目录,1计算机系统结构的基本概念,2指令系统,3存储系统,返回总目录,4输入输出系统,5标量处理机,7互连网络,基本要求:)计算机系统结构的基本概念,定量原理,指令的格式设计,CISC与RISC,虚拟存储页面替换算法,Cache映象,通道流量分析,数据相关,线性与非线性流水线技术及性能分析,互连网络基本概念;学习重点:)定量原理,指令格式设计,RISC,页面替换算法,Cache映象,流水线性能分析;,1计算机系统结构的基本概念,1.1名词解释,返回目录,1.计算机体系结构的定义:程序员所看到的计算机的属性,即概念性结构与功能特性。Amdahl提出的体系结构:是指传统机器级的体系结构。即
2、一般所说的机器语言程序员所看到的传统机器级所具有的属性。2.透明性 在计算机技术中,对这种本来是存在的 事物或属性,但从某种角度看又好象不存在。,大概率事件优先原则:即对于大概率事件(最常见事件),赋予它优先的处理权和资源使用权,以获得全局的最优结果。Amdahl定律:加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。程序的局部性原理:程序在执行时所访问地址的分布不是随机的,而是相对地簇聚;这种簇聚包括指令和数据两部分。程序局部性包括程序的时间局部性和空间局部性。时间局部性:程序即将用到的信息很可能就是目前正在使用的信息空间局部性:程序即将用到的信息很可能与目前正在使
3、用的信息相邻或临近。,1计算机系统结构的基本概念,1.1名词解释,系统加速比:系统改进前与改进后总执行时间之比CPI:指令周期数(Cycles of Instruction)并行性:在同一时刻或同一时间间隔内完成两种或两种以上的性质相同或不同的工作。翻译:先把N1级程序全部变换成N级程序之后,再去执行N级程序,在执行过程中,N1级程序不再被访问(基于层次结构)解释:每当一条N1级指令被译码后,就直接去执行一串等效的N级指令,然后再去取下一条N1级指令,依此重复进行。,1计算机系统结构的基本概念,1.1名词解释,例:设某程序中FP操作占20%,其平均CPI=4.0,FPSQR操作的比例占4%,其
4、平均CPI=20.0,其它指令平均CPI=1.20,现采用两种方法进行优化:a.将FP操作的CPI减为2;b.将FPSQR操作的CPI减少为12;问1:哪一种方法更优?问2:若同时采用a、b方法,系统的加速比为多少?,1计算机系统结构的基本概念,1.2,问1解:比较2方案的CPI即可 CPIa=(1-20%-4%)CPI其他+(20%CPIFP)+(4%CPIFPSQR)=76%1.20+20%2+4%20=2.11CPIb=(1-20%-4%)CPI其他+(20%CPIFP)+(4%CPIFPSQR)=76%1.20+20%4+4%12=2.3 所以,采用方法a更优。,1计算机系统结构的基本
5、概念,1.2,问2解:加速比:,1计算机系统结构的基本概念,1.2,例:假设我们考虑条件分支指令的两种不同设计方法如下:,(1)CPUA:通过比较指令设置条件码,然后测试条件码进行分支 CPUB:在分支指令中包括比较过程,在两种CPU中,条件分支指令都占用2个时钟周期而所有其它指令占用1个时钟周期,对于CPUA,执行的指令中分支指令占20%;由于每个分支指令之前都需要有比较指令,因此比较指令也占20%。由于CPUB在分支时需要比较,因此假设它的时钟周期时间是CPUA的1.25倍。问1:哪一个CPU更快?,1计算机系统结构的基本概念,1.3,我们不考虑所有系统问题,所以可用CPU性能公式。占用2
6、个时钟周期的分支指令占总指令的20%,剩下的指令占用1个时钟周期。所以 CPIA=20%2+80%1=1.2则CPU性能为:总CPU时间A=ICA 1.2 时钟周期A,解1:,1计算机系统结构的基本概念,1.3,根据假设,有:时钟周期B=1.25 时钟周期A在CPUB中没有独立的比较指令,所以CPUB的程序量为CPUA的80%,分支指令的比例为:20%/80%=25%这些分支指令占用2个时钟周期,而剩下的75%的指令占用1个时钟周期,因此:CPIB=0.25 2+0.75 1=1.25因为CPUB不执行比较,故:ICB=0.8 ICA,解1:,1计算机系统结构的基本概念,1.3,因此CPUB性
7、能为:总CPU时间B=ICB CPIB 时钟周期B=0.8 ICA 1.25(1.25 时钟周期A)=1.25 ICA 时钟周期A在这些假设之下,尽管CPUB执行指令条数较少,CPUA因为有着更短的时钟周期,所以比CPUB快。,解1:,1计算机系统结构的基本概念,1.3,例:我们分析一个用于Web服务器系统的处理器的性能。假定采用某增强方式使新的CPU处理Web服务器应用程序的运行速度是原来处理器中的10倍,同时假定此CPU有40%的时间用于计算,另外60%的时间用于I/O操作。那么增强性能后总的加速比是多少?解:增强比例=0.4 增强加速比=10,1计算机系统结构的基本概念,1.4,例:设某
8、计算机系统执行程序中,可向量化部分最大可达70%。一种实现方法是采用陈列多处理机即硬件方式实现,使60%的向量化指令执行速度加快到原来的10倍,另一种方法是采用优化编译系统的方法实现,使向量化程序可达70%,且速度可增加3倍。请比较这两种方案哪种更优。解:通过计算加速比知,硬件方案较优!,1计算机系统结构的基本概念,1.5,Assume a simple load/store machine with the following instruction frequency:,conditional branches currently use simple test against 0Shou
9、ld we add complex comparison/branch combination(BEQ Rn,Rm,LOC orBNE Rn,Rm,LOC)-25%of branches can use the complex scheme and save(节省了)the preceding ALU instruction-The CPU cycle time(CCT)of the machine has to be 10%longer-Will this increase CPU performance?,1计算机系统结构的基本概念,1.6,1计算机系统结构的基本概念,1.6,使用40MH
10、z时钟速率的处理机执行一个测试程序,它的主要指令类型所执行的指令数及所需的时钟周期数如下,试计算执行此程序的有效CPI,MIPS速率及总的CPU时间。(p33习题1.19),1计算机系统结构的基本概念,1.7 p33习题1.19,总时钟周期数=45000*1+32000*2+15000*2+8000*2=155000总指令数=45000+32000+15000+8000=100000CPI=总时钟周期数/总指令数=1.55总CPU执行时间=155000/40*10-6=0.003875sMIPS=总指令数*10-6/总时间=0.1/0.003875=25.8,1计算机系统结构的基本概念,1.7
11、 p33习题1.19,1计算机系统结构的基本概念,1.8 p33习题1.20,某工作站采用时钟频率为15MHz,处理速率为10MIPS的处理机来执行一个已知混合程序。假定每次存储器存取为1周期延迟,试问:(1)此计算机的有效CPI是多少?(2)时钟提高到30MHz,但存储器子系统速率不变。这样,每次存储器存取需要2个时钟周期。如果30%指令每条只需要1次存储存取,而另外5%每条需要2次存储存取,还假定已知混合程序的指令数不变,并与原工作站兼容,试求改进后的处理机性能。,1计算机系统结构的基本概念,1.8 p33习题1.20,解:(1)设该程序执行时间为t,则CPI=总时钟周期数/总指令数=(t
12、*15M)/(t*10M)=1.5(2)公式:CPUtime=IC*CPI*CCT 即有:CPUtime=指令数指令周期数cpu周期时间,1计算机系统结构的基本概念,1.8 p33习题1.20,1计算机系统结构的基本概念,1.9 p34习题1.21,解:,2指令系统,2.1名词解释,CISC:复杂指令集计算机(Complex Instruction Set Computer)。强化指令功能,设置一些功能复杂的指令,把一些原来由软件实现的、常用的功能改用硬件的指令系统来实现,基于这种指令集结构而设计实现的计算机系统称为CISC计算机。RISC:精简指令集计算机(Reduced Instructi
13、on Set Computer)。尽量简化指令功能,只保留那些功能简单,能在一个周期内执行完成的指令,较复杂的功能用一段子程序来实现,这种计算机系统称为RISC计算机。,返回目录,2指令系统,2.2简答,RISC的关键技术有哪些?延时转移技术指令取消技术重叠寄存器窗口技术指令流调整技术硬件为主,固件为辅,2指令系统,2.3,例:某计算机有10条指令,它们的使用频率分别为 0.30,0.20,0.16,0.09,0.08,0.07,0.04,0.03,0.02,0.01(1)用霍夫曼编码对它们的操作码进行编码,并计算平均代码长度。(2)用扩展霍夫曼编码法对操作码进行编码,限两种操作码长度,并计算
14、平均代码长度。,2指令系统,2.3,答:(1)霍夫曼树如下:,2指令系统,2.3,霍夫曼编码的结果以及各编码的长度如下所示:0.30 0.20 0.16 0.09 0.08 0.07 0.04 0.03 0.02 0.0111 01 101 001 1001 1000 0001 00001 000001 000002 2 3 3 4 4 4 5 6 6平均代码长度为(0.30+0.20)2+(0.16+0.09)3+(0.08+0.07+0.04)4+0.035+(0.02+0.01)6=1+0.75+0.76+0.15+0.18=2.84,2指令系统,2.3,(2)用扩展霍夫曼编码法对操作码
15、进行编码,限两种操作码长度,采用长度为2和长度为4两种编码:0.30 0.20 0.16 0.09 0.08 0.07 0.04 0.03 0.02 0.01 00 01 1000 1001 1010 1011 1100 1101 1110 1111平均代码长度为(0.30+0.20)2+(1-0.30-0.20)4=3.0,2指令系统,2.4P127页习题2.13,解:,2指令系统,2.4P127页习题2.13,解:,2指令系统,2.4P127页习题2.13,解:,2指令系统,2.5P127页习题2.14,2指令系统,2.5P127页习题2.14,解:(1)应采用Huffman编码,构造Hu
16、ffman树如下:,2指令系统,2.5P127页习题2.14,2指令系统,2.5P127页习题2.14,2指令系统,2.5P127页习题2.14,2指令系统,2.6P128页习题2.15,2指令系统,2.6P128页习题2.15,解:(1)首先,我们可以根据指令地址的数量来决定各种指令在指令空间上的分布:,2指令系统,2.6P128页习题2.15,2指令系统,2.6P128页习题2.15,2指令系统,2.7P129页习题2.20,解:,START:MOVE AS,R1 MOVE NUM,R2LOOP:MOVE(R1),AD-AS(R1)INC R1 DEC R2 BGT LOOP HALTNU
17、M:N,HALT指令共取100次,但前99次都被取消。,2指令系统,2.7P129页习题2.20,解:(1),START:MOVE AS,R1 MOVE NUM,R2 MOVE(R1),AD-AS(R1)LOOP:INC R1 DEC R2 BGT LOOP _ _ MOVE(R1),AD-AS(R1)_ _ HALTNUM:N,MOVE指令共取100次,但前99次都被正常执行,只有最后1次被取消。,2指令系统,2.7P129页习题2.20,解:(2),因为采用指令取消技术前,取消指令次数为99次,而在采用指令取消技术后,取消指令次数为1次,所以节省的指令周期数为:99198,2指令系统,2.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机系统结构 计算机系统 结构 习题 答案 全套

链接地址:https://www.31ppt.com/p-5904118.html