向量流水线计算机技术.ppt
《向量流水线计算机技术.ppt》由会员分享,可在线阅读,更多相关《向量流水线计算机技术.ppt(26页珍藏版)》请在三一办公上搜索。
1、向量处理机结构目前已成为解决数值计算问题的一种最重要的高性能结构。向量处理机的性能价格比是很引人注目的,因为与相同价格的串行处理机相比,它们的向量运算吞吐量要高出12个数量级。但是,这种吞吐量提高只是对特定结构问题而言,也就是说,局限于那些可以转化为向量运算的问题。,第六章 向量流水线技术(P347)前言,本章任务了解向量处理机特点、一般结构,并掌握提高向量处理机性能方法。,6.1 特点 多数为巨型机,绝大多数向量处理机都采用流水线结构。当一条流水线不能达到所要求性能时,设计者往往采用多条单功能流水线。,第六章 向量流水线技术-向量处理机的结构,为实现向量化处理,向量处理机操作部件一般采用流水
2、线结构。下面是典型的向量加法器结构:,向量处理机设计中要解决两个问题:(1)设法维持连续数据流(提供连续的A和B)。(2)设法降低对存储器压力。向量处理机一般采取以下技术措施:(1)用多独立存储器模块达到需要带宽。例STAR-100,32体。(2)增设高速中间存储器向量寄存器。根据采用技术措施不同,向量处理机分为两种不同结构:(1)存储器存储器结构(2)寄存器寄存器结构,第一节向量处理机的结构,(1)存储器存储器结构,第一节向量处理机的结构,主存储器由多个存储器模块构成。流水线运算器与主存储器系统间有三条相互独立的数据通路,各数据通路可同时工作。,第一节向量处理机的结构,假设一个存储周期占两个
3、处理机周期。下图是计算C=AB最理想方法。,第一节向量处理机的结构,典型系统:CDC的STAR-100,1973年完成。主要技术参数:主频:40ns;字长:64位;主存容量:100万字,磁芯存储器,32体,存储周期为1.28微妙,每个体的数据宽度为8个字,STAR-100存储系统的频带宽度为:(32*8)/1.28微妙=2*字/秒,使主存有较高带宽的另一种方法是由一级或多级中间存储器形成一个层次结构存储器系统,其中带宽最高的这级存储器安排在距处理器最近位置。即寄存器一寄存器结构。CRAY-1是世界上第一台向量流水处理巨型机。是美国Cray公司于1976年提供产品。运算速度达亿次秒以上巨型机。速
4、度这么高的一个原因是它采用了层次结构的存储器系统。,第一节向量处理机的结构,(2)寄存器-寄存器结构,简化的Cray-l的框图:主存与流水结构运算器间有一级或两级中间存储器。中间存储器与CACHE比特点:不透明;访问快;支持新数据结构,(3)两种结构的简单比较:第一种结构是依靠主存来保证流水线所需的操作数。因此主存必须具有至少和运算器所要求带宽一样高的带宽。这就要求主存或者存取速度足够快,或者分为多个独立的存储模块,或者两者都具备,因为运算器要求的最大带宽非常高。第二种结构是通过容量比主存小得多的中间存储器即寄存器来保证很高的带宽。这样,低速存取主存就不会妨碍流水结构运算器连续运行。第二种结构
5、的另一好处是流水结构运算器可以重叠进行,因为高速寄存器带宽足以满足几个流水结构运算部件的带宽要求。,第一节向量处理机的结构,6.2 典型工作方式 CRAY-1是世界上第一台向量流水处理巨型机。(1)CRAY-1技术术语 向量寄存器组V0,V1,V7。分量计数器 链接方式(P370)启动、输出延迟(各1拍)。,D=A*(BC)向量长度=64,B和C已取至V0和 V1,V3AV2 V0V1V4 V2*V3第一、二条指令既无寄存器冲突,也无功能部件冲突,可并行执行。第三条与第一、二条指令均存在先写后读的相关冲突,可将第三条与第一、二条指令链接。,由于同步的要求,数据进入和流出每个功能部件,包括访存都
6、需要1拍时间。,(2)链接技术(369)前一条指令结果不必送回存储器直接作为后一条指令的操作数,甚至可在前一条指令完成之前就使用其结果。,若采用链接技术,则执行时间为:(1 61)(17 1)(Nl)=N16拍若这三条指令全部用串行方法,则执行时间为:(161)N1(16十1)N1(171)N1=3N 22拍若前两条指令并行执行,第三条指令串行执行,则执行时间为:(1 61)N1(17 l)N1=2N 15拍,假设向量长度为N,,分析:实现链接除了无向量寄存器使用冲突和无功能部件使用冲突外,还有时间上的要求,只有当前一条指令的第一个结果分量送入结果向量寄存器的那一个时钟周期方可链接,若错过该时
7、刻就不能进行链接,只有当前一条向量指令全部执行完毕,释放向量寄存器资源后才能执行后面指令。另外,当一条向量指令的两个源操作数分别是两条先行指令的结果寄存器时,要求先行的两条指令产生运算结果的时间必须相等,即要求有关功能部件的延迟时间相等,此外还要求这两条向量指令的向量长度必须相等,否则也不能链接。,功能部件冲突 指令运算符号相同;Vi变量冲突 指令中使用的Vi变量相同,具体有3种形式,即左同名、右同名、上右下左同名。冲突:A=B+C A=B+C A=B+C A=D*E D=B*E B=D*E相关:A=B+C D=A*E(4)CRAY-1分析指令的3条策略无相关,无冲突 同时启动;有相关,无冲突
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 向量 流水线 计算机技术
链接地址:https://www.31ppt.com/p-4968008.html