计算机系统结构-第五章(向量处理机).ppt
《计算机系统结构-第五章(向量处理机).ppt》由会员分享,可在线阅读,更多相关《计算机系统结构-第五章(向量处理机).ppt(67页珍藏版)》请在三一办公上搜索。
1、向量处理机,基本概念基本结构设计目标关键技术协处理器性能评价,基本概念,本章内容,向量处理机什么是向量处理向量处理方式,向量处理机,本章内容基本概念,具有向量数据表示和向量指令系统的处理机,是解决数值计算问题的一种高性能计算机结构。有两个主要优点:效率高和适用性广,一般都采用流水线结构,有多条流水线并行工作。向量处理机通常属大型或巨型机,也可以用微机加一台向量协处理器组成。一般向量计算机中包括有一台高性能标量处理机。必须把要解决的问题转化为向量运算,向量处理机才能充分发挥作用,2 之 1,向量处理机,本章内容基本概念,2 之 2,什么是向量处理 例子,本章内容基本概念,用Fortran语言编写
2、的一个简单程序:DO 100 I=1,NA(I)=B(I)+C(I)100B(I)=2*A(I+1),3 之 1,什么是向量处理 标量处理,本章内容基本概念,INITIALIZE I=110READB(I);读数指令READC(I)ADD B(I)+C(I);运算指令STOREA(I)B(I)+C(I);存数指令READA(I+1)MULTIPLY2*A(I+1);运算指令STOREB(I)2*A(I+1);存数指令INCREMENT II+1;运算指令IF IN GOTO 10;条件转移指令STOP,3 之 2,什么是向量处理 向量处理,本章内容基本概念,A(1:N)=B(1:N)+C(1:
3、N);并行运算指令TEMP(1:N)=A(2:N+1);并行取数指令B(1:N)=2*TEMP(1:N);并行运算指令一条向量指令处理N个操作数或N对操作数,3 之 3,向量处理方式,横向处理方式纵向处理方式纵横处理方式,C语言程序for(i=1;i=n;i+)yi=ai(bi+ci);,本章内容基本概念,采用同一例子说明,横向处理方式,本章内容基本概念向量处理方式,处理方法 又称为水平处理方式、横向加工方式等。向量计算是按行的方式从左至右横向地进行。举例 逐个分量进行处理:假设中间结果为T(I)计算第1个分量:T(1)B(1)C(1)Y(1)A(1)T(1)计算第2个分量:T(2)B(2)C
4、(2)Y(2)A(2)T(2)计算最后一个分量:T(N)B(N)C(N)Y(N)A(N)T(N),2 之 1,横向处理方式,本章内容基本概念向量处理方式,分析 存在两个问题:在计算向量的每个分量时,都发生写读数据相关,流水线效率低;如果采用多功能流水线,还必须频繁进行流水线切换。所以横向处理方式对向量处理机不适合,即使在标量处理机中,也经常通过编译器进行指令流调度。,2 之 2,纵向处理方式,本章内容基本概念向量处理方式,处理方法 也称为垂直处理方式、纵向加工方式等。向量计算是按列的方式自上而下纵向地进行。举例T(1)=B(1)+C(1)T(2)=B(2)+C(2)T(n)=B(n)+C(n)
5、Y(1)=A(1)T(1)Y(2)=A(2)T(2)Y(N)=A(N)T(N),2 之 1,纵向处理方式,本章内容基本概念向量处理方式,分析 因为数据相关不影响流水线连续工作,不同的运算操作只需要切换1次,所以这种处理方式适用于向量处理机。结果的存储直接面向存储器,n的大小可以不受限制,但速度受到存储器吞吐量的限制。采用向量指令只需要2条:VADDB,C,TVMULA,T,Y,2 之 2,纵横处理方式,本章内容基本概念向量处理方式,处理方法 又称为分组处理方式、纵横向加工方式等。横向处理和纵向处理相结合的方式。即:将长度为N的向量分成若干组,每组长度为n,组内采用纵向处理方式,组间采用横向处理
6、方式。,3 之 1,纵横处理方式,本章内容基本概念向量处理方式,举例第组:T(1,n)=B(1,n)+C(1,n)Y(1,n)=A(1,n)T(1,n)第组:T(n+1,2n)=B(n+1,2n)C(n+1,2n)Y(n+1,2n)=A(n+1,2n)T(n+1,2n)最后第k+1组:T(kn+1,N)=B(kn+1,N)+C(kn+1,N)Y(kn+1,N)=A(kn+1,N)+T(kn+1,N),3 之 2,纵横处理方式,本章内容基本概念向量处理方式,分析 减少了访问主存储器的次数,降低对存储器信息流量的要求,也减少访问存储器发生冲突引起的等待时间,因而提高了处理速度。适合用于寄存器-寄存
7、器结构的向量处理机中,因为向量寄存器的长度是有限的,例如,每个向量寄存器有64个寄存器。当向量长度N大于向量寄存器长度n时,需要分组处理。,3 之 3,基本结构,本章内容,向量处理机的最关键问题是存储器系统能够满足运算部件带宽的要求。主要采用两种方法:存储器存储器结构 多个独立的存储器模块并行工作。处理机结构简单,对存储系统的访问速度要求很高。寄存器寄存器结构 运算通过向量寄存器进行。需要大量高速寄存器,对存储系统访问速度的要求降低,而且利用高速寄存器可完成对矩阵元素的特殊运算。,存储器存储器结构,本章内容基本结构,假设A、B、C都是有8个元素的向量,现向量处理机需完成如下运算:C=A+B。,
8、多端口存储器系统,流水结构加法器,B,A,C=A+B,3 之 1,存储器存储器结构,本章内容基本结构,3 之 2,存储器存储器结构,采用多个存储体交叉和并行访问来提高存储器速度,但应该注意解决存储器访问冲突。下面分情况进行介绍(假设一个存储周期占两个处理机周期):,本章内容基本结构,理想情况 实际情况,3 之 3,数据存储,本章内容基本结构存储器存储器结构,2 之 1,处理时序图,本章内容基本结构存储器存储器结构,2 之 2,问题及解决,问题 实际情况与理想情况并非一样,例如:向量的元素有时不能存放在我们希望的存储体。解决 可以在流水线的输入端和输出端增加缓冲器来消除争用存储器。,本章内容基本
9、结构存储器存储器结构,多端口存储器系统,流水结构加法器,B,A,C=A+B,3 之 1,缓冲器,缓冲器,缓冲器,处理时序图(所有向量都从模块0开始存放),本章内容基本结构存储器存储器结构,3 之 2,A延迟2,总 结,本章内容基本结构存储器存储器结构,3 之 3,操作数缓冲器和写结果缓冲器主要用于解决访问存储器冲突。主要优缺点:硬件结构简单,造价低;但速度相对较低。,寄存器寄存器结构,本章内容基本结构,把存储器-存储器结构中的缓冲器改为向量寄存器,运算部件需要的操作数从向量寄存器中读取,运算的中间结果也写到向量寄存器中。向量寄存器与标量寄存器的主要差别是:一个向量寄存器能够保存一个向量,例如:
10、64个64位寄存器,用以实现连续访问一个向量的各个分量。需要有标量寄存器和地址寄存器等共同工作。,3 之 1,举 例 CRAY-1向量处理机结构,本章内容基本结构,8个向量寄存器(V)8个64个64bit,主存储器8MB64个个体,12个流水线结构的运算部件,缓冲寄存器(T)64个64bit,标量寄存器(S)8个64bit,缓冲寄存器(B)64个24bit,地址寄存器(A)8个24bit,指令缓冲寄存器256个16bit,指令寄存器,程序计数器,3 之 2,提 示,本章内容基本结构,3 之 3,主要向量处理机都采用寄存器寄存器结构,包括Cray处理机(Cray-1、Cray-2、X-MP、Y-
11、MP、C90、T90和 SV1)、日本的超级计算机(NEC SX/2 SX/5、Fujitsu VP200 VPP5000、Hitachi S820 和S-8300)和小型超级计算机(Convex C-1 C-4)。第一台向量处理机(CDC)采用存储器存储器结构。从现在开始,我们集中讨论寄存器寄存器结构。,设计目标,本章内容,较好地维持向量/标量性能平衡可扩展性随处理机数目的增加而提高增加存储器系统的容量和性能提供高性能的I/O和易访问的网络,较好地维持向量/标量性能平衡,本章内容设计目标,实际的应用问题中通常既有向量计算又有标量计算,而且两类计算有一定的比例。关键问题是:希望向量硬件和标量硬
12、件都能够充分利用,不要空闲。,3 之 1,较好地维持向量/标量性能平衡,本章内容设计目标,向量平衡点(vector balance point):为了使向量/标量硬件设备的利用率相等,一个程序中向量代码所占的百分比。例如:一个系统的向量运算速度为90Mflops,标量运算速度为 10Mflops。如果程序的90是向量运算,10是标量运算,硬件利用率最高;则向量平衡点为0.9。,3 之 2,较好地维持向量/标量性能平衡,本章内容设计目标,向量处理机的向量平衡点必须与用户程序的向量化程度相匹配。例如:IBM向量计算机维持较低的向量与标量比例,定在35的范围之间。这种做法能够适应通用应用问题对标量和
13、向量处理要求。但大多数超级计算机的向量平衡点在90%或更高,此时对目标代码向量化比例的依赖也大。,3 之 3,可扩展性随处理机数目的增加而提高,本章内容设计目标,可扩展性是指在确定的应用背景下,向量处理机系统要随处理机数目的增加而线性地提高。可扩展性的三个目标为:规模可扩展性、换代可扩展性和问题可扩展性。,关键技术,本章内容,链接技术向量循环/分段开采技术向量递归技术稀疏矩阵的处理技术,链接技术,本章内容关键技术,向量指令的类型向量运算中的相关和冲突向量链接技术,向量指令的类型,本章内容关键技术链接技术,以CRAY-1向量处理机为例,有四类指令:向量与向量操作:ViVj op Vk 向量与标量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机系统 结构 第五 向量 处理机
链接地址:https://www.31ppt.com/p-6023883.html