欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    cache的性能分析及改进方法ppt课件.ppt

    • 资源ID:2002809       资源大小:23.45MB        全文页数:20页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    cache的性能分析及改进方法ppt课件.ppt

    ,姓 名,老 师,黄 亚 玲,汤文兵老师,Cache性能分析及改进方法, 搜集整理,目录,1,2,3,4,关于Cache的基本知识,Cache的性能分析,Cache的性能改进方法,致谢,www.51pp 搜集整理,Cache的基本知识,Cache,1,2,3,4,1,2,3,4,对Cache的认识,Cache的工作原理,Cache的地址映射方式,替换算法,www.51pptmoban. com 搜集整理,什么是Cache?,Cache系统,Cache的作用,对Cache的认识,Cache又称高速缓冲存储器,位于CPU和内存之间,是一种特殊的子存储系统,Cache系统通常由一级高速缓存L1 Cache和二级高速缓存L2 Cache组成。L1 Cache通常分别用来存放数据和指令。,Cache的产生就是为了提高CPU对存储器的访问速度。,Cache的工作原理,程序访问的局部性:对大量典型程序运行情况的分析结果表明,在一个较短的时间间隔内,由程序产生的地址往往集中在存储器逻辑地址空间的很小范围内。指令地址的分布本来就是连续的,再加上循环程序段和子程序段要重复执行多次。因此,对这些地址的访问就自然地具有时间上集中分布的倾向。 数据分布的这种集中倾向不如指令明显,但对数组的存储和访问以及工作单元的选择都可以使存储器地址相对集中。这种对局部范围的存储器地址频繁访问,而对此范围以外的地址则访问甚少的现象,就称为程序访问的局部性。,Cache的工作原理,Cache的工作原理是基于程序的访问局部性。在主存和CPU通用寄存器之间设置一个高速的容量相对较小的存储器,把正在执行的指令地址附近的一部分指令或数据从主存调入这个存储器,供CPU在一段时间内使用。,Cache结构和工作原理图,Cache的地址映射方式,全相联映射方式:主存的任意一块可以映射到Cache中的任意一块,优点:命中率比较高,Cache存储空间利用率高缺点:访问相关存储器时,每次都要与全部内容比较,速度低,成本高,因而应用少,Cache的地址映射方式,直接相联映射方式:主存储器中的一块只可以映射到Cache特定的一个块中,优点:地址映射方式简单,数据访问时只需检查区号是否相等,因而可以得到比较快的访问速度,硬件设备简单缺点:替换操作频繁,命中率较低,Cache的地址映射方式,组相联映射方式:主存储器中的每一块可以被放置到Cache唯一的一个组中的任何一个位置,优点:块的冲突概率比较低,块的利用率大幅提高,块失效率明显降低缺点:实现难度和造价要比直接相联映射方式高,替换算法,Cache可以采用的替换算法主要有以下几种:随机替换(RAND)算法 随机确定替换的块,方法简单易于实现,但命中率低先入先出(FIFO)算法替换最先调入的块,不符合局部性规律近期最少使用(LRU)算法 选择替换最近最少使用的块,命中率高,符合程序局部性原理,Cache性能分析,CPU执行时间,平均访问存储器时间(AMAT),CPU执行时间,例子,问:假定有一台计算机,当所有存储器访问操作都能在Cache中命中时,CPI为1.0;数据访问只有load和store指令,这些指令占全部指令的50%;缺失代价为25个时钟周期,缺失率为2%。问当所有指令都在Cache中命中时,计算机性能能提高多少?答:Cache始终命中时的计算机性能为:,例子,实际Cache的计算机性能为:两者的性能比为:结论:不发生Cache缺失时计算机性能是原来的1.75倍,平均访存时间,设H为命中率,平均访存时间(AMAT)可定义为:在多级存储系统中,平均访存时间(AMAT)可定义为:,Cache性能改进方法,通过对cache的性能分析,可知失效开销,命中时间和失效率是衡量cache的重要指标。,www.51pp 搜集整理,减少失效开销,减少命中时间,降低失效率,减少失效开销,使读失效优于写 写缓冲器导致对存储器的访问复杂化,而且写缓冲器是滞后的,所以推迟对读失效的处理。写缓冲合并 如果写缓冲器中已经有了待写入的数据,则进行地址匹配,若存在匹配的地址并且缓冲器中位置空闲,就进行写缓冲合并。请求字处理技术 尽早将请求字发送到CPU非阻塞cache技术 Cache失效时仍允许CPU对其进行其他命中访问采用两级cache 第一级Cache(L1)小而快,第二级Cache(L2)容量大,减少命中时间,命中时间直接影响着处理器的时钟频率。目前的计算机Cache的访问时间限制了处理器的时钟频率。采用容量小,结构简单的Cache 硬件越简单,速度越快;便于与CPU放在一块芯片上虚拟Cache 访问Cache的索引以及Cache中的标识都使用虚拟地址Cache访问流水化 对第一级Cache的访问按流水方式访问TraceCache 存放CPU所执行的动态指令,降低失效率,强制性失效:当第一次访问一个块时,该块不在Cache 中,需从下一级存储器中调入Cache。方法:增加块的大小,预取Cache,容量失效:如果程序执行时所需的块不能全部调Cache 中,则某些块被替换后又重新被访问。方法:增加容量,冲突失效:在组相联或直接相联映射中,若太多的块到 同一组或块中,则会出现该组或块中某个 块被替换,然后又重新访问的情况。方法:提高相联度,谢谢您的聆听,

    注意事项

    本文(cache的性能分析及改进方法ppt课件.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开