让读失效优先于写.PPT
《让读失效优先于写.PPT》由会员分享,可在线阅读,更多相关《让读失效优先于写.PPT(19页珍藏版)》请在三一办公上搜索。
1、5.4.1 让读失效优先于写,5.4 减少Cache失效开销,1.Cache中的写缓冲器导致对存储器访问的 复杂化,2.解决问题的方法(读失效的处理)推迟对读失效的处理(缺点:读失效的开销增加,如50)检查写缓冲器中的内容,3.在写回法Cache中,也可采用写缓冲器,第五章 存储层次,5.4.2 子块放置技术,1.为减少标识的位数,可采用增加块大小的 方法,但这会增加失效开销,故应采用子 块放置技术。,2.子块放置技术:把Cache块进一步划分为更 小的块(子块),并给每个子块赋予一位有 效位,用于指明该子块中的数据是否有效。Cache与下一级存储器之间以子块为单位传 送数据。但标识仍以块为单
2、位。,3.举例(动画演示),5.4 减少Cache 失效开销,5.4.3 请求字处理技术,1.请求字 从下一级存储器调入Cache的块中,只有 一个字是立即需要的。这个字称为请求字。,2.应尽早把请求字发送给CPU 尽早重启动:调块时,从块的起始位置开 始读起。一旦请求字到达,就立即发送给 CPU,让CPU继续执行。请求字优先:调块时,从请求字所在的位 置读起。这样,第一个读出的字便是请求 字。将之立即发送给CPU。,5.4 减少Cache 失效开销,3.这种技术在以下情况下效果不大:Cache块较小 下一条指令正好访问同一Cache块的另 一部分,5.4 减少Cache 失效开销,5.4.4
3、 非阻塞Cache技术,1.非阻塞Cache:Cache失效时仍允许CPU进行 其它的命中访问。即允许“失效下命中”。,2.进一步提高性能:“多重失效下命中”“失效下失效”(存储器必须能够处理多个失效),3.重叠失效个数对平均访问时间的影响,5.4 减少Cache 失效开销,非阻塞Cache平均存储器等待时间 与阻塞Cache的比值,1,2,浮点程序,76,51,64,39,整数程序,81,78,78,重叠失效个数,5.4 减少Cache 失效开销,对于图5.18所描述的Cache,在两路组相联和“一次失效下命中”这两种措施中,哪一种对浮点程序更重要?对整数程序的情况如何?假设8KB数据Cac
4、he的平均失效率为:对于浮点程序,直接映象Cache为11.4%,两路组相联Cache为10.7%;对于整数程序,直接映象Cache为7.4%,两路组相联Cache为6.0%。并且假设平均存储器等待时间是失效率和失效开销的积,失效开销为16个时钟周期。,例 5.11,5.4 减少Cache 失效开销,对于浮点程序,平均存储器等待时间为:失效率直接映象失效开销11.4%161.82 失效率两路组相联失效开销10.7%161.71 1.71/1.820.94,对于整数程序:失效率直接映象失效开销7.4%161.18 失效率两路组相联失效开销6.0%16 0.96 0.96/1.18=0.81,解:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 失效 优先
链接地址:https://www.31ppt.com/p-5464485.html