并行处理技术课件.pptx
《并行处理技术课件.pptx》由会员分享,可在线阅读,更多相关《并行处理技术课件.pptx(130页珍藏版)》请在三一办公上搜索。
1、什么是并行处理为什么要开发并行处理技术并行机的分类及基本结构并行处理的基本问题和技术,主要内容,多个处理单元(a collection of computing elements)协作、通信(cooperate&communicate)快速求解大型问题(to solve large problems fast)并行体系结构:用通信体系结构(Communication Architecture)对传统的体系结构进行扩展。,并行处理的基本问题,处理器之间协同的基础是什么?互连与通信编程人员使用何种方式编程?编程模型如何保证并行程序的正确性?存储一致性,并行处理的基本问题,1、互连与通信的问题互连网
2、络的定义及特性静态网络动态网络多处理器通信问题,并行处理的基本问题,并行计算机往往采用多个处理节点。其根本思想就是将要完成的任务尽量分布到各个处理节点并发执行,在最理想的情况下并行计算机的性能是所有节点计算性能的简单相加。但是由于节点间存在着通信延时和各个节点间的同步关系,使得系统的整体性能通常达不到理想情况。比如在某些MPP上其持续速度只是峰值速度的3%10%。同时,并行计算也逐步向着松耦合(loosely Coupled)和复杂化的方向发展。大量的SMP集群(CLUMPs)的出现,使得并行计算机内部节点与节点间的通信瓶颈愈发明显。因此,解决并行计算机的通信问题也就成为了一个研究的热点。,互
3、连与通信的问题,互连与通信的问题,互连网络的定义及特性定义:由开关元件按一定拓扑结构和控制方式构成的网络,以实现计算机系统内部多个处理机或多个功能部件间的相互连接。互连网络对并行处理机的性能影响很大,是系统构成的主要部分。互连网络有三大要素,即互连拓扑(包括连接通路)、开关元件和控制方式。由于这三大要素的工作方式和所处的地位不同,才出现了各种各样的互联网络。,操作方式:同步通信(Synchronous Communication):收发双方必须在时间上同步。这类似于电话网中需要呼叫方和被呼叫方同步。异步通信(Asynchronous Communication):收发双方不需要同步。这类似于发
4、送和接收mail。,互连与通信的问题,控制策略:集中控制(Centralized control):互连网络中的各级互连开关由一组信号统一控制。其优点是控制简单,实现容易,但网络的灵活性相对较差。分布控制(Distributed control):互连网络中的各级互连开关由多个或多组信号分别控制,各(组)开关可处于不同状态。其优点是网络的灵活性强,但控制相对复杂,实现相对困难。,互连与通信的问题,电路交换(Circuit switching):采用与电话网类似的方式,在数据传输期间,从发送节点到接收节点的整个连接通路必须保持。,优点:信息的传输延迟小,对一次接续而言,传输时延固定不变。信息的编
5、码方案和信息格式由双方协调,不受网络限制。缺点:电路资源被通信双方独占,电路利用率低。,交换方式:,分组交换(Packet switching):采用存储转发方式,把数据分解成许多比较短的、规格化的片段,进行交换和传输。,优点:为用户提供了灵活的通信环境(不同速率、不同代码、不同通信协议机制等)。实现线路动态统计复用,通信线路利用率高,可以在一条物理线路上同时提供多条信息通路。可靠性高,经济性好。缺点:由于网络附加的传输信息较多,对长报文通信的传输效率比较低。技术实现复杂。,互连与通信的问题,网络拓扑结构:静态网络(Static network)静态网络的特点与指标典型的静态网络动态网络(Dy
6、namic network)互连函数多级互联网络,互连与通信的问题,A.静态网络的特点 静态网络由点点直接相连而成,这种连结方式在程序执行过程中不会改变。如果用图来表示,结点代表开关,边代表通信链路,则:结点间的链路无源,不能重构;开关元件与处理机相连;不直接相连结点间的通信需通过中间结点中转。,静态网络的特点与指标,B.静态网络的指标结点度:与结点相连接的边(链路或通道)数,表示节点所需要的I/O端口数,模块化要求结点度保持恒定。根据通道到结点的方向,结点度可以进一步表示为:结点度=入度+出度 其中入度是进入结点的通道数,出度是从结点出来的通道数。距离:与两个结点之间相连的最少边数。网络直径
7、:网络中任意两个结点间距离的最大值。,静态网络的特点与指标,网络规模:网络中结点数,表示该网络功能连结部件的多少。等分宽度:某一网络被切成相等的两半时,沿切口的最小边数称为该网络的等分宽度。结点间的线长:两个结点间的线的长度。对称性:从任何结点看,拓扑结构都一样,这种网络实现和编程都很容易。结点是否同构。通道是否有缓冲。,静态网络的特点与指标,1).线性阵列,对N个结点的线性阵列,有N-1条链路,直径为N-1(任意两点之间距离的最大值),度为2,不对称,等分宽度为1。N很大时,通信效率很低。,典型的静态网络,2).环,对N个结点的环,考虑相邻结点数据传送方向:单向环:链路数为N,直径N-1,度
8、为2,对称,等分宽度为2。双向环:链路数为N,直径N/2,度为2,对称,等分宽度为2。比如KSR-1(1990)。,典型的静态网络,3).带弦环,对上图中12个结点的带弦双向环,结点度为3:链路数为18,直径4(比如红色结点),度为3,不对称,等分宽度为2。,结点度为4:链路数为24,直径3(比如红色结点),度为4,对称,等分宽度为8。,典型的静态网络,4).链接(全互联)链接是带弦环的一种特殊情形。链接中的每个结点和其他结点之间都有单一的直接链路。如下图中8个结点的链接:,有28条链路,直径为1,度为7,对称,等分宽度为16。,典型的静态网络,5).树形,4层的二叉树,一棵K层完全二叉树应有
9、N=2K-1个结点,对大结点度为3,直径为2(K-1)(即右边任意一个叶子结点到左边任意一个叶子结点)。不对称,等分度为1。由于结点度为常数,所以树是一种可扩展的系统结构。,典型的静态网络,树形的扩展:,带环树,二叉胖树,这两种结构都可以缓解根结点的瓶颈问题。,典型的静态网络,6).星形,星形实际上是一种二层树(如右图)。有N个结点的星形网络,有N-1条链路,直径为2,最大结点度为N-1,非对称。,典型的静态网络,有N个结点的rr网(其中),有2r(r-1)=2N-2r条链路,直径为2(r-1),结点度为4,非对称,等分宽度为r。,7).网,典型的静态网络,有N个结点的rr网(其中),有2N条
10、链路,直径为r-1,结点度为4。,网的变形:Illiac 网,典型的静态网络,有N个结点的rr网(其中),有2N 条链路,直径为2r/2,结点度为4,对称。,网的变形:环形网(2DTorus),典型的静态网络,网的变形:搏动式阵列(Systolic Array),典型的静态网络,8).超立方体,典型的静态网络,一个n-立方体由N=2n个结点构成,它们分布在n维上,每维有两个结点。直径为n,结点度为n,对称。由于结点度随维数线性增加,所以超立方体不是一种可扩展结构。例子:Intel的iPSC/1、iPSC/2、nCUBE,典型的静态网络,9).带环立方体,一个带环n-立方体由N=2n个结点环构成
11、,每个结点环是一个有n个结点的环,所以结点总数为n2n个。直径通常为2n,结点度为3,对称。,典型的静态网络,特点:网络的开关元件有源,链路可通过设置这些开关的状态来重构。只有在网络边界上的开关元件才能与处理机相连。,动态网络,互连函数是一级动态互联网络的一种抽象描述,是从输入到输出的一个映射。排列:N个数的每一种有确定次序的放置方法叫做一个N排列。置换:把一个N排列变成另一个N排列的变换叫做N阶置换。在有N个输入端和N个输出端的网络中,输入端和输出端的连接关系可以用置换来表示(输入端与输出端一一对应)。,互联函数,1).恒等函数,其中,Xn-1 Xn-2Xk X0是PE的地址(通常为二进制)
12、。n为3时的恒等函数的连接情形如下:,互联函数,2).方体函数(cube0,cube1,cuben-1),方体函数是由n个互连函数组成,其中0kn。比如,n为3时,3-立方体各结点地址如下:,互联函数,Cube0:,互联函数,Cube1:,互联函数,Cube2:,3).洗牌函数:均匀洗牌(Shuffle-Exchange),互联函数,子洗牌,即最低k位循环左移一位。,互联函数,超洗牌,即最高k-1位循环左移一位。,互联函数,逆洗牌函数,互联函数,4).蝶式,互联函数,5).PM2I函数(加减2i)共有2n个互连函数,对N个结点的网络为,例1:N=8(8个结点),则n=log28=3,所以:i=
13、0,1,2;j=0,1,7。6个PM2I函数如下:,互联函数,PM2+0:(0 1 2 3 4 5 6 7),PM2-0:(7 6 5 4 3 2 1 0),互联函数,PM2+1:(0 2 4 6)(1 3 5 7),PM2-1:(6 4 2 0)(7 5 3 1),互联函数,PM22:(0 4)(1 5)(2 6)(3 7),互联函数,A.多级网络的三要素(1)开关单元:a个输入a个输出的开关单元记做aa的开关单元,其中,a是2的整数倍。常见的有2 2、4 4、8 8等。根据开关单元功能的多少,2 2又可以分为两功能和四功能开关。如下图所示:,多级互连网络,0,1,0,1,直送,多级互连网络
14、,(2)级间互连模式(InterStage Connection):均匀洗牌、蝶式、多路洗牌(比如四路洗牌即是把牌平均分成4份,然后4堆分别进行均匀洗牌)、纵横开关(Cross Switch)及立方体连结等。(3)控制方式级控制:每级只有一个控制信号单元控制:每个开关一个控制信号部分级控制:几个开关合用一个控制信号,多级互连网络,B.网,0,1,2,3,4,5,6,7,0,1,2,3,4,5,6,7,第0级,第1级,第2级,网的特点:开关单元:22四功能开关ISC:洗牌变换控制方式:采用单元控制方式。当目的地址编码从高位开始的第i位(从0开始)为0时,第i级的22开关的输入端与上输出端连接,否
15、则输入端与下输出端连接。例子:UIUC的CedarIBM的RP3NYU的Ultracomputer,多级互连网络,0,1,2,3,4,5,6,7,0,1,2,3,4,5,6,7,第0级,第1级,第2级,无阻塞的实现置换1=(0 7 6 4 2)(1 3)(5),多级互连网络,0,1,2,3,4,5,6,7,0,1,2,3,4,5,6,7,第0级,第1级,第2级,置换2=(0 6 4 7 3)(1 5)(2)在开关F、G、H、I和J上发生阻塞,F,G,H,J,I,多级互连网络,网的特点(2):并不是所有的置换在网中一次通过便可以实现。网是阻塞网络:出现冲突时,可以采用几次通过的方法来解决冲突。,
16、多级互连网络,0,1,2,3,4,5,6,7,0,1,2,3,4,5,6,7,第0级,第1级,第2级,网的广播功能:0018个输出端,多级互连网络,44开关构成的网:多路洗牌如16输入4路洗牌:网路级数为log416=2,0,1,第1级,2,3,4,5,6,7,8,9,10,11,12,13,14,15,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,第0级,级间变换:Sh(Sh(),可以认为是由4个2*2开关组成,多级互连网络,网的特点(3):当采用kk开关元件时,则可以定义k路洗牌函数来构造更大的级数为logkn的网络。,多级互连网络,C.蝶式网络(Butter
17、fly switch network)蝶式网络的开关不允许广播功能,它实际上是Omega网的一个子集。两级64 64的蝶式网络如下图所示:它采用16个8 8交叉开关构成,两级间采用8路洗牌连接。,多级互连网络,两级64 64的蝶式网络,多级互连网络,总线本质上是一组导线和插座,用于处理器、存储模块和外围设备之间的数据传输。系统总线用于主设备如处理器和从设备如存储模块之间传输数据。总线仲裁逻辑每次只授予一个请求存储总线,因此也称争用总线。单总线层次总线,总线,目前已建立了许多标准总线,例如PCI、VME、Multibus、Sbus、MicroChannel、IEEE Futurebus。大多数总
18、线在构造单处理机系统时价格很低。我们关心的是多处理机总线和层次总线,用它们来构造SMP、NUMA和DSM机器。这些可扩展的总线一般用硬件来支持高速缓存一致性、快速多处理机同步、以及分离事务中断处理等。,总线,M,P,C,高速缓存,IF,系统总线(在底板或中夹板上),局部总线,存储器,存储器总线,C,IF,IOP,IF,IF,IF,IF,C,缓存器,缓存器,局部总线,局部总线,CPU板,I/O板,网络接口卡,以太网,打印机,磁盘,存储板,总线,总线互连的缺陷 总线有多个处理机分时共享,因此即使当总线带宽很高,每个处理器的带宽也只是总带宽的一部分。此外总线由于缺乏冗余机制易于出错,请总线也有有限的
19、可扩展性。这些缺陷主要是受封装技术和价格因素的约束。总线一般限制在很小的机架内,当层次总线扩展到几个机架时,始终扭转和全局时问题就变得难于克服。使用交叉开关和多级网络代替总线结构将在一定程度上克服这些缺陷。,总线,基本术语与性能指标通信方式寻径算法软件开销,多处理器通信问题,基本通信方式 无论网络拓扑结构如何,高性能计算机节点间通信对于用户是透明的。其通信模式无外乎以下4种:单播(Unicast):一个源节点到一个目的节点;多播(Multicast):一个源节点到多个目的节点;广播(Broadcast):一个源节点到全体节点;会议(Conference):多个源节点到一个目的节点。,多处理器通
20、信问题,1).消息、包和片消息(Message):是在多计算机系统的处理接点之间传递包含数据和同步消息的信息包。它是一种逻辑单位,可由任意数量的包构成。包(Packet):包的长度随协议不同而不同,它是信息传送的最小单位,64-512位。片(Flit):片的长度固定,一般为8位。它们的相互关系如下图:,基本术语与性能指标,包,消息,基本术语与性能指标,2).互连网络 互连网络用来在多处理机(计算机)系统的处理结点之间传递消息。,互连网络性能的两个重要指标:传输时延(Transmission Latency)吞吐量(Throughput),互连网络的描述:拓扑(Topology)寻径算法(Rou
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 并行 处理 技术 课件

链接地址:https://www.31ppt.com/p-2175000.html