计算机系统结构-第七章(多处理机).ppt
《计算机系统结构-第七章(多处理机).ppt》由会员分享,可在线阅读,更多相关《计算机系统结构-第七章(多处理机).ppt(75页珍藏版)》请在三一办公上搜索。
1、多处理机,什么是多处理机?多处理机结构一致性问题同步程序并行化多处理机性能,什么是多处理机?,本章内容,2 之 1,具有若干台处理机,在统一的操作系统控制下,在硬件和软件各级上相互作用,来协同求解一个大而复杂的问题。根据Flynn分类法多处理机是MIMD。利用多任务处理可以提高处理速度,利用系统的重组能力可以提高可靠性。,提 示,本章内容,2 之 2,因为多处理机系统结构是一个巨大而多样的领域,其中很多领域仍处于不成熟的阶段,所以本课程集中于多处理机设计的主流进行讨论:由少量到中等数量的处理机(128)组成的机器。,多处理机结构,本章内容,根据存储器的组织形式,多处理机有两种基本结构:,集中式
2、共享存储器结构分布式共享存储器结构,集中式共享存储器结构多处理机,本章内容多处理机结构,存储器是一个独立的子系统,通过互连网络(交叉开关/总线)为所有的处理机共享,任何两台处理机都可以通过访问共享的存储器单元实现通信。由于共享存储器对每个处理机都是对称关系,而且所有处理机对共享存储器的访问时间都相同,这种结构的多处理机也称为对称多处理机(SMP)和均匀存储器存取(UMA)。,2 之 1,图 示,本章内容多处理机结构,2 之 2,处理机,1级/多级Cache,存储器,处理机,1级/多级Cache,处理机,1级/多级Cache,处理机,1级/多级Cache,I/O系统,分布式共享存储器结构(DSM
3、)多处理机,本章内容多处理机结构,存储器分布在各处理机中,但这些存储器在逻辑上统一编址,形成一个为所有处理机共享的虚拟共享存储器。处理机之间信息交换的物理实现仍然是通过点-点的通信。由于任何一个处理机访问本地存储器都较快,但是访问分布在其他处理机的远程存储器则较慢,这种结构的多处理机也称为非均匀存储器存取(NUMA)。,3 之 1,图 示,本章内容多处理机结构,3 之 2,处理机+Cache,存储器,互 连 网 络,I/O,处理机+Cache,存储器,I/O,处理机+Cache,存储器,I/O,处理机+Cache,存储器,I/O,处理机+Cache,存储器,I/O,处理机+Cache,存储器,
4、I/O,比 较,本章内容多处理机结构,3 之 3,一致性问题,本章内容,Cache一致性存储一致性,Cache一致性,本章内容一致性问题,问题现象原因分析解决方法,问题现象,本章内容一致性问题Cache一致性,Cache一致性是指私有Cache中共享数据的副本和共享存储器中共享数据之间的一致性。,P1,C,u:5主存,C,C,P2,P3,特征 多处理器对相同存储单元的操作引起的一致性。,u:5,u:5,u:7,原因分析,本章内容一致性问题Cache一致性,共享可写数据引起的不一致性进程迁移引起的数据不一致性I/O传输造成的数据不一致性,共享可写数据引起的不一致性,不同处理器对相同单元在各自Ca
5、che的拷贝的异步写操作。,本章内容一致性问题Cache一致性原因分析,P1,X,X,P2,X,处理机,Cache,共享存储器,更新之前,P1,X,X,P2,X,更新之后(写通过),P1,X,X,P2,X,更新之后(写回),进程迁移引起的数据不一致性,本章内容一致性问题Cache一致性原因分析,多处理器中的进程迁移,而又不互相通报。,P1,X,X,P2,X,处理机,Cache,共享存储器,初始状态,P1,X,X,P2,X,迁移之前(写通过),进程,P1,X,X,P2,X,迁移之后(写通过),进程,进程,I/O传输造成的数据不一致性,本章内容一致性问题Cache一致性原因分析,绕过Cache拷贝
6、拥有者的I/O操作。,P1,X,X,处理机,Cache,共享存储器,I/O前,P2,X,I/O,P1,X,X,I/O后,X,P2,X,P1,X,X,I/O后(写回),X,P2,X,共享存储器,输入,共享存储器,输出,解决方法,前两种原因监听法目录法,第三种原因禁止法刷新法,本章内容一致性问题Cache一致性,监听协议,基本原理具体实现采用写通过策略的Cache采用写回策略的Cache写一次(Write-Once)协议,本章内容一致性问题Cache一致性解决方法,基本原理,本章内容一致性问题Cache一致性解决方法监听协议,4 之 1,本方法只适用于采用基于总线互连结构的系统中,由于系统中每个处
7、理机都能觉察到存储器系统正在进行的活动,在某个活动破坏了Cache的一致性时,Cache控制器将采取相应的动作使有关的拷贝无效或更新。,写无效/写更新,本章内容一致性问题Cache一致性解决方法监听协议,4 之 2,使用监听协议来保持Cache一致性有两种方法:方法一:写无效(Write Invalidate)策略 在本地Cache的数据块修改时使远程数据块都无效。方法二:写更新(Write Update)策略 在本地Cache数据块修改时通过总线把新的数据块广播给含该块的所有其他Cache。提示:采用写无效或写更新策略与Cache采用写回还是写通过方式无关。,图 示,本章内容一致性问题Cac
8、he一致性解决方法监听协议,4 之 3,P1,X,X,P2,X,处理机,Cache,共享存储器,更新之前,P1,X,I,P2,X,更新之后(Write-Invalidate),P1,X,X,P2,X,更新之后(Write-Update),应用情况,本章内容一致性问题Cache一致性解决方法监听协议,4 之 4,由于写更新法在本地Cache修改时需要通过总线把修改过的数据块的内容广播给所有含该数据块的其他Cache,增加了总线的负担,所以在一般的应用系统中,极少使用写更新法。本方法实现简单,但只适用于总线式互连的多处理机,而且写无效法和写更新法都要占用总线不少时间,因此只能用于机数少的多处理机中
9、。,采用写通过策略的Cache,本章内容一致性问题Cache一致性解决方法监听协议,Cache数据块有两种状态:有效和无效,有效状态表示该数据块内容正确,无效状态表示该数据块内容已“过时”或不在Cache中。RL、WL表示本地处理机对Cache的读和写操作,RR、WR表示远程处理机对Cache中相同内容数据的读和写操作。,采用写回策略的Cache,本章内容一致性问题Cache一致性解决方法监听协议,2 之 1,采用写回策略的Cache,Cache数据块有三种状态:只读、读写和无效。只读状态表示整个系统中有多个数据块拷贝是正确的;读写状态表示数据块至少被修改过一次,存储器中相应数据块还没有修改,
10、在整个系统中只有一个数据块拷贝是正确的;无效状态表示该数据块内容已“过时”或不在Cache中。RL、WL表示本地处理机对Cache的读和写操作,RR、WR表示远程处理机对Cache中相同内容数据的读和写操作。,本章内容一致性问题Cache一致性解决方法监听协议,2 之 2,写一次协议,本章内容一致性问题Cache一致性解决方法监听协议,4 之 1,本方法为了降低总线流量,结合了写回和写通过策略的优点。在第一次写Cache采用写通过策略,以后写Cache采用写回策略,此时整个系统中只有一份正确的拷贝。,写一次协议,本章内容一致性问题Cache一致性解决方法监听协议,4 之 2,RR,写一次协议,
11、本章内容一致性问题Cache一致性解决方法监听协议,4 之 3,Cache数据块有四种状态:有效、保留、重写和无效。有效状态表示整个系统中有多个数据块拷贝是正确的;保留状态表示数据从存储器读入Cache后只被写过一次,Cache和存储器中拷贝都正确;重写状态表示Cache中的数据块被写过多次,而且是唯一正确的数据块;无效状态表示该数据块内容已“过时”或不在Cache中。RL、WL表示本地处理机对Cache的读和写操作,RR、WR表示远程处理机对Cache中相同内容数据的读和写操作。,写一次协议,本章内容一致性问题Cache一致性解决方法监听协议,4 之 4,主要优点:减少大量的无效操作,提高了
12、总线效率。主要缺点:当主存储器的内容无效时,读缺失引起的总线读操作必须禁止主存储器的操作(以免造成总线冲突),而大多数总线不支持这种操作。IEEE Futurebus+总线支持该操作。,目录协议,基本原理具体实现全映射目录协议有限目录协议链式目录协议,本章内容一致性问题Cache一致性解决方法,基本原理,本章内容一致性问题Cache一致性解决方法目录协议,监听协议涉及大量广播通信及收集状态信息的任务,即使是总线型网络也会使总线流量大大增加。如果使无效信息只发给有关的数据块,可以避免广播,这需要有一套管理数据块的结构,这就是Cache一致性目录协议方案。,3 之 1,基本原理,建立目录表 为Ca
13、che在共享存储器建立一个目录表,用于保存每个数据块的状态:包括用几个标志位分别指示这个信息块的副本在其他几个处理机的Cache中是否有,另外再设置一个标志位(重写位)用以指明是否有一个Cache允许将有关数据写入。,本章内容一致性问题Cache一致性解决方法目录协议,3 之 2,目录协议用在实现广播功能比较困难的网络。主要思想为:,基本原理,使用目录表 在CPU对Cache进行写操作时,系统根据目录表中的信息将所有其它存有相同内容的Cache拷贝无效,并置重写位。在CPU对Cache进行读操作时,如果重写未置位,则说明该内容未经重写,此时若Cache读缺失,则从主存储器中或拥有正确内容的Ca
14、che中读入块并修改目录即可;如果读命中,则直接读即可。,本章内容一致性问题Cache一致性解决方法目录协议,3 之 3,全映射目录协议,本章内容一致性问题Cache一致性解决方法目录协议,5 之 1,目录项:重写位 存在位 数据块,C,1,0,1,X,共享存储器,CacheP2,V,CacheP1,V,X,CacheP3,V,X,V-有效位:0-无效;1-有效C-重写位:0-不许;1-允许存在位:0-不存在;1-存在 位数等于处理机数,举 例,本章内容一致性问题Cache一致性解决方法目录协议,5 之 2,目录项:重写位 存在位 数据块,0,0,0,0,X,共享存储器,CacheP2,0,C
15、acheP1,0,CacheP3,0,所有Cache都没有块X的拷贝,有效位,有效位,有效位,举 例,本章内容一致性问题Cache一致性解决方法目录协议,5 之 3,目录项:重写位 存在位 数据块,0,1,1,1,X,共享存储器,CacheP2,1,X,CacheP1,1,X,CacheP3,1,X,三个处理机都读过块X后,有效位,有效位,有效位,举 例,本章内容一致性问题Cache一致性解决方法目录协议,5 之 4,目录项:重写位 存在位 数据块,1,0,0,1,X,共享存储器,CacheP2,0,CacheP1,0,CacheP3,1,X,P3获得写块X权力后,有效位,有效位,有效位,特
16、点,全映射目录协议的效率比较高,但是其目录开销比较大,与处理器数平方成正比(因为目录项的多少与处理器数成正比,而且每个目录项的大小也与处理器数成正比),不具有可扩展性。,本章内容一致性问题Cache一致性解决方法目录协议,5 之 5,有限目录协议,本章内容一致性问题Cache一致性解决方法目录协议,4 之 1,目录项:重写位 存在位 数据块,C,1,1,X,共享存储器,CacheP2,V,CacheP1,V,X,CacheP3,V,X,V-有效位:0-无效;1-有效C-重写位:0-不许;1-允许存在位:0-不存在;1-存在 位数 等于 log2处理机数,举 例,本章内容一致性问题Cache一致
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机系统 结构 第七 处理机
链接地址:https://www.31ppt.com/p-6023880.html