程序性能评价与优化.ppt
《程序性能评价与优化.ppt》由会员分享,可在线阅读,更多相关《程序性能评价与优化.ppt(37页珍藏版)》请在三一办公上搜索。
1、第四章 程序性能评价与优化,第四章 程序性能评价与优化,4.1 并行程序的执行时间和并行算法的时间复杂性 4.1.1 并行程序的执行时间 4.1.2 并行算法的时间复杂性 4.1.3 代价最优算法4.2 并行程序的性能评价 4.2.1 加速比定律 4.2.2 基准测试程序4.3 程序的性能优化 4.3.1 串行程序性能优化 4.3.2 并行程序性能优化,4.1 并行程序的执行时间和并行算法的时间复杂性,4.1.1 并行程序的执行时间,在消息传递系统中,求解一个算法的整个执行时间 tp 应包括:计算时间 tcomp 通信时间 tcomm 即:tp=tcomp+tcomm对 COW 而言,通信时间
2、一般近似地表示为:tcomm=tstartup+n tdata在对计算时间进行计时,常采用程序中需要执行的计算步来表示。,4.1.2 并行算法的时间复杂性,令 f(n)和 g(n)是定义在自然数集合N 上的两个函数,定义1:如果存在两个正数 c 和 n0,使得对于所有的 n n0 均有f(n)c g(n),则标记为:f(n)=(g(n)我们称 g(n)为 f(n)的上界。定义2:如果存在两个正数 c 和 n0,使得对于所有的 n n0 均有f(n)c g(n),则标记为:f(n)=(g(n)我们称 g(n)为 f(n)的下界。,定义3:如果存在正数 c1、c2 和 n0,使得对于所有的n n0
3、 均有c1 g(n)f(n)c2 g(n),则标记为 f(n)=(g(n)我们称 g(n)为 f(n)的紧致界。即:如果 f(n)=(g(n)且 f(n)=(g(n)则 f(n)=(g(n)算法的执行时间也称算法的时间复杂性,常用其上界、下界 和紧致界 表示。,4.1.2 并行算法的时间复杂性,计算/通信比:tcomp/tcomm如果计算和通信时间具有相同的时间复杂性,则当问题规模 n 增加时,通信开销往往会随之增加;我们希望计算/通信比大于1,当问题规模 n 增加时,通信开销会随之相对减少。例如:通信时间=(n),而计算时间=(n2),当 n 增大到一定值后,计算时间将支配整个并行算法的执行
4、时间。,4.1.2 并行算法的时间复杂性,并行算法的代价:并行算法的运行时间 t与所需的处理器数 p 之积,即 c=t*p。如果一个并行算法的代价与相应的(最佳)串行算法的执行时间在同一个数量级上,则称该并行算法为代价最优的。,4.1.3 代价最优算法,4.2 并行程序的性能评价,4.2 并行程序的性能评价,并行程序性能评测与并行计算机体系结构、并行算法、并行程序设计一起构成了“并行计算”研究的四大分支。在并行计算系统上进行计算的主要目标就是要加速整个计算过程,所以研究并行系统(并行算法、并行程序)加速性能十分重要。随着计算规模的增加和机器规模的扩大,研究计算系统的性能是否能随着处理器数目的增
5、加而按比例的增加,就是并行计算的可扩展问题。为了方便地、可比较地评价并行计算机系统的性能,人们提出了许多基准程序,了解这些基准测试程序对于我们客观公正地评价并行计算机系统非常重要。,在给定的并行计算系统上给定的应用,并行程序的执行速度相对于串行程序加快的倍数,就是该并行程序的加速比。,4.2.1 加速比定律,我们要给出两个加速比性能模型:适用于固定计算负载的 Amdahl 定律 适用于扩展问题的 Gustsfson 定律,4.2.1 加速比定律,Amdahl 定律的出发点:固定不变的计算负载;固定的计算负载分布在多个处理器上的,增加处理器加快执行速度,从而达到加速的目的。Gustsfson 定
6、律的出发点:对于很多大型计算,精度要求很高,即在此类应用中精度是个关键因素,而计算时间是固定不变的。此时为了提高精度,必须加大计算量,相应地亦必须增多处理器数才能维持时间不变;除非学术研究,在实际应用中没有必要固定工作负载而计算程序运行在不同数目的处理器上,增多处理器必须相应地增大问题规模才有实际意义。,4.2.1 加速比定律,参数定义:P:并行计算系统的处理器数W:问题规模WS:应用程序中的串行分量WP:可并行化部分f:串行分量的比例(f=WS/W),1-f:并行分量的比例TS=T1:串行执行时间,TP:并行计算时间S:加速比,E:并行效率,4.2.1 加速比定律,1)适用于固定计算负载的A
7、mdahl定律当并行计算机中处理器数目增加时,固定负载就被分配给更多的处理器去并行执行,其主要目的是想尽可能快地的得出结果,即计算任务的实时性要求更高。Amdahl 定律(1967):设 f 为给定计算任务中必须串行执行的部分所占比例(0f 1),对于一台含有 p 个处理器的并行计算机,其最大可能的加速比为:,4.2.1 加速比定律,4.2.1 加速比定律,S=,S=,当 p 无限增加时,加速比趋于 1/f,对于部分问题,如实时性计算方面问题,一般为固定工作负载。但对于许多问题,扩大计算机规模是为了解决更大规模的问题,因此在对并行程序(并行算法)进行评价时,采用Amdahl定律就不能反映算法的
8、可扩展性。,4.2.1 加速比定律,2)适用于扩展问题的Gustafson定律有些计算任务要求在给定的时间内希望提高计算精度,即在给定的时间内增加处理器的数量使计算量提高,如我们希望数值天气预报的数据采样模型单位更小。在精度占主导位置的应用领域中,我们希望象在小机器上解小问题一样在大机器上能解规模大的问题,并使二者所花费的时间大体相同。,4.2.1 加速比定律,Gustafson定律(1988):对于一台并行计算机,当问题中可并行部分扩大 p 倍时,其加速比也随之增长:,4.2.1 加速比定律,4.2.1 加速比定律,若我们用 f 来表示,可将上式变为:,=f+p(1-f),基准测试程序(be
9、nchmark)用于测试计算机系统的性能,试图提供一种客观、公正的评价机器性能的标准。目前在高性能计算领域,比较有影响的基准测试程序有HINT测试、Perf 测试、IOzone测试,以及Linpack测试、NAS Parallel Benchmark、SPEC HPC测试等。这些基准测试可以在一定程度上对并行计算机系统方案进行评价,可以对并行计算机系统的市场销售提供参考,另外,在基准测试中形成的优化方法对应用程序设计与优化具有重要的指导意义。,4.2.2 基准测试程序,4.3 程序的性能优化,串行程序性能的优化是并行程序性能优化的基础。一个好的并行程序首先应该拥有良好的单机性能。影响程序单机性
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 程序 性能 评价 优化
链接地址:https://www.31ppt.com/p-6596175.html