《多处理机》PPT课件.ppt
《《多处理机》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《多处理机》PPT课件.ppt(52页珍藏版)》请在三一办公上搜索。
1、第七章 多处理机,国防科技大学计算机学院,一个问题图书馆将一批新书上架,可以有多种方式。假定将书按类上架,而将书架依据在书库中的位置分成一些组。解决办法 若由一工人单独完成,不能在要求的时间内完成任务。若由多个工人完成,假定每次一人仅往书架上放一本书。可以采用两种不同的方式:,(1)将所有的书籍平均分配给每个人去完成。这种划分方法不是太有效,原因是每个工人为了将书上架必须走遍所有的书架。(2)将所有书架分成一些组,且平均分配给各个工人负责,同时将所有图书平均分配给每个工人去上架。如果工人发现一本书属于自己所负责的书架上,则将其放入书架。否则,将这本书传给所在书架对应的工人。这种分法对应的效率比
2、较高。,结论将一个任务划分成一些子任务,并分配给多个工人去完成,工人们相互合作、并在需要时相互传递图书,这种协调的工作方式可较快地完成任务。并行计算就是严格地按照上述原理来完成的。,并行计算相关的两个概念 任务划分(task partitioning)将图书平均分配给所有工人为任务划分的一个例子。通信(communication)工人之间传递图书为子任务通信的例子。什么是并行计算?并行计算是指同时对多个任务或多条指令、或对多个数据项进行处理。完成此项处理的计算机系统称为并行计算机系统,它是将多个处理器通过网络以一定的连接方式有序地组织起来。,并行计算的研究内容:(1)并行计算机设计(2)有效算
3、法的设计(3)评价并行算法的方法(4)并行计算机语言(5)并行编程环境与工具(6)并行程序的可移植性(7)并行计算机的自动编程,并行计算的应用领域:(1)天气预报(2)卫星数据处理(3)石油数据处理(连续优化问题)(4)调度问题(5)VLSI设计(离散优化问题)(6),天气预报考虑3000*3000平方公里的范围,垂直方向的考虑高度为11公里。将3000*3000*11立方公里的区域分成0.13立方公里的小区域,则将近有1011个不同的小区域。另外还需考虑时间因素,将时间参数量化。假定考虑48小时天气预报。每一小区域的计算包括参数的初始化及与其它区域的数据交换。若每一小区域计算的操作指令为10
4、0条,则整个范围一次计算的指令为1011*100=1013,两天的计算次数将近100次,因此,指令总数为1015条。用一台10亿次/秒(PIII500)计算,大约需要280小时。,美国政府的HPCC计划公布的重大挑战性应用磁记录技术:研究静磁和交互感应以降低高密度磁盘的噪音新药设计:通过抑制人的免疫故障病毒蛋白酶的作用来研制治疗癌症与艾滋病的药物高速民航:用计算流体动力学来研制超音速喷气发动机催化作用:仿生催化剂计算机建模,分析合成过成中的酶作用燃料燃烧:通过化学动力学计算,揭示流体力学的作用,设计新型发动机海洋建模:对海洋活动与大气流的热交换进行整体海洋模拟,美国政府的HPCC计划公布的重大
5、挑战性应用臭氧耗损:研究控制臭氧损耗过程中的化学与动力学机制数字解析:用计算机研究适时临床成像、计算层析术、磁共振成像 大气污染:对大气质量模型进行模拟研究,控制污染的传播,揭示其物理与化学机理蛋白质结构设计:对蛋白质组成的三维结构进行计算机模拟研究图像理解:实时绘制图像或动态密码破译:破译由长位数组成的密码,寻找该数的两个乘积因子,并行计算的应用分类(1)计算密集型(Compute-Intensive)这一类型的应用问题主要集中在大型科学工程计算与数值模拟(气象预报、地球物理勘探等)(2)数据密集型(Data-Intensive)Internet的发展,为我们提供了大量的数据资源,但有效地利
6、用这些资源,需要进行大量地处理,且对计算机的要求也相当高,这些应用包括数字图书馆、数据仓库、数据挖掘、计算可视化。(3)网络密集型(Network-Intensive)通过网络进行远距离信息交互,来完成用传统方法不同的一些应用问题。如协同工作、遥控与远程医疗诊断等,7.1 引言7.2 多处理机的存储器体系结构7.3 互连网络 7.4 同步与通信7.5 并行化技术,单处理机的发展正在走向尽头?并行计算机在未来将会发挥更大的作用。获得超过单处理器的性能,最直接的方法就是把 多个处理器连在一起;2.自1985年以来,体系结构的改进使性能迅速提高,这种改进的速度能否持续下去还不清楚,但通过 复杂度和硅
7、技术的提高而得到的性能的提高正在 减小;3.并行计算机应用软件已有缓慢但稳定的发展。,7.1 引 言,本章重点:中小规模的机器(处理器的个数100)(多处理机设计的主流)7.1.1 并行计算机体系结构的分类1.按照Flynn分类法,可把计算机分成,单指令流单数据流(SISD)单指令流多数据流(SIMD)多指令流单数据流(MISD)多指令流多数据流(MIMD),2.MIMD已成为通用多处理机体系结构的选择,原因:(1)MIMD具有灵活性。(2)MIMD可以充分利用商品化微处理器在性能价格 比方面的优势。3.MIMD机器分为两类:(每一类代表了一种存储器的结构和互连策略)(1)集中式共享存储器结构
8、 这类机器有时被称为UMA(uniform memory access)机器。,(2)分布式存储器结构 每个结点包含:在许多情况下,分布式存储器结构优于采用 集中式共享存储器结构。分布式存储器结构需要高带宽的互连。,处理器 存储器 IO,分布式存储器结构的优点(1)如果大多数的访问是针对本结点的局部存储器,则可降低对存储器和互连网络的带宽要求;(2)对局部存储器的访问延迟低。主要缺点 处理器之间的通信较为复杂,且各处理器之间访问 延迟较大。,1.两种地址空间的组织方案(1)物理上分离的多个存储器可作为一个逻辑上共享的 存储空间进行编址。这类机器的结构被称为分布式共享存储器(DSM)或可缩放共享
9、存储器体系结构。DSM机器被称为NUMA(non-uniform memory access)机器。(2)整个地址空间由多个独立的地址空间构成,它们在 逻辑上也是独立的,远程的处理器不能对其直接寻 址。,7.1.2 通信模型和存储器的结构模型,每一个处理器-存储器模块实际上是一个单独的计算机,这种机器也称为多计算机。2.两种通信模型,共享地址空间的机器 利用Load和Store指令中的地址隐含地进行数据通信多个地址空间的机器 通过处理器间显式地传递消息完成(消息传递机器)消息传递机器根据简单的网络协议,通过传递消息来 请求某些服务或传输数据,从而完成通信。,例如:一个处理器要对远程存储器上的数
10、据进行访问或操作(1)发送消息,请求传递数据或对数据进行操作;远程进程调用(RPC,remote process call)(2)目的处理器接收到消息以后,执行相应的操 作或代替远程处理器进行访问,并发送一个 应答消息将结果返回。,7.1.3 通信机制的性能 三个关键的性能指标:1.通信带宽 理想状态下的通信带宽受限于处理器、存储器和互 连网络的带宽。2.通信延迟 理想状态下通信延迟应尽可能地小。通信延迟 发送开销跨越时间传输延迟接收开销,3.通讯延迟的隐藏 如何才能较好地将通信和计算或多次通信之间重 叠起来,以实现通信延迟的隐藏。通常的原则是:只要可能就隐藏延迟。通信延迟隐藏是一种提高性能的
11、有效途径,但 它对操作系统和编程者来讲增加了额外的负担。,1.共享存储器通信的主要优点(1)与常用的集中式多处理机使用的通信机制兼容。(2)当处理器通信方式复杂或程序执行动态变化时 易于编程,同时在简化编译器设计方面也占有 优势。(3)当通信数据较小时,通信开销较低,带宽利用 较好。(4)通过硬件控制的Cache减少了远程通信的频度,减少了通信延迟以及对共享数据的访问冲突。,7.1.4 不同通信机制的优点,2.消息传递通信机制的主要优点(1)硬件较简单。(2)通信是显式的,从而引起编程者和编译程序 的注意,着重处理开销大的通信。在共享存储器上支持消息传递相对简单,但在消 息传递的硬件上支持共享
12、存储器就困难得多。所有对共享存储器的访问均要求操作系统提供地 址转换和存储保护功能,即将存储器访问转换为消 息的发送和接收。,并行处理面临着两个重要的挑战:(可通过Amdahl定律解释)1.有限的并行性使机器要达到好的加速比十分困难。,程序中有限的并行性 相对较高的通信开销,7.1.5 并行处理面临的挑战,例7.1 如果想用100个处理器达到80的加速比,求原计算程序中串行部分所占比例。解:动画演示,面临的第二个挑战主要是指多处理机中远程访问 的较大延迟。在现有的机器中,处理器之间的数据通信大约需 要5010000个时钟周期。,远程访问一个字的延迟时间,例7.2 一台32个处理器的计算机,对远
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多处理机 处理机 PPT 课件

链接地址:https://www.31ppt.com/p-4871098.html