计算机算法基础(第二章).ppt
《计算机算法基础(第二章).ppt》由会员分享,可在线阅读,更多相关《计算机算法基础(第二章).ppt(81页珍藏版)》请在三一办公上搜索。
1、2023/11/17,计算机算法基础,2023/11/17,第二章 分治法“分”而治之,2.1 一般方法 对大规模问题的求解 利用分治法求解大规模问题,1.基本思想 在问题的输入规模很大时,无法直接求解,则采用将整个问题分成若干个小问题后分而治之。,一般情况下,子问题与原始问题“同质”,2023/11/17,算法2.1 分治策略的抽象化控制procedure DANDC(p,q)global n.A(1:n);integer m,p,q;/1pqn/if SMALL(p,q)then return(G(p,q)else mDIVIDE(p,q)/pmq/return(COMBINE(DANDC
2、(p,m),DANDC(m+1,q)endifend DANDC,注:k=2:二分是最常用的分解策略;SMALL(p,q):布尔函数,判断输入规模q-p+1是否足够小而无需再进一步分就可求解;G(p,q):对输入规模为q-p+1的子问题求解(SMALL(p,q)为真时);DIVIDE(p.q):对输入规模为q-p+1的子问题进一步分解,返回值为p,q区间进一步的分割点(SMALL(p,q)为真时;COMBINE(x,y):子结果的合并函数,将区间p,m和m+1,q上的子问题的解合并成上级区间p,q上的“较完整”的解。当p=1,q=n时,就得到整个问题的解。,2.分治策略的抽象化控制,2023/
3、11/17,DANDC的计算时间 若所分成的两个子问题的输入规模大致相等,则DANDC总的计算时间可用递归关系式表示,如下:g(n)n足够小 T(n)=2T(n/2)+f(n)否则 注:T(n):表示输入规模为n的DANDC计算时间 g(n):表示对足够小的输入规模直接求解的计算时间 f(n):表示COMBINE对两个子区间的子结果进行合并 的时间(该公式针对具体问题有各种不同的变形),2023/11/17,2.2 二分检索(折半查找),1.问题的描述 已知一个按非降次序排列的元素表a1,a2,an,判定某给定的元素x是否在该表中出现。若是,则找出x在表中的位置并返回其所在下标 若非,则返回0
4、值。,2023/11/17,分治求解策略分析:定义问题的形式描述:I=(n,a1,a2,an,x)问题分解:选取下标k,由此将I分解为3个子问题:I1=(k-1,a1,a2,ak-1,x)I2=(1,ak,x)I3=(n-k,ak+1,ak+2,an,x)对于I2,若ak=x,则有解k,对I1、I3不用再求解;否则,若xak,则只在I3中求解,对I1不用求解;I1、I3上的求解可再次采用分治方法划分后求解(递归过程),2023/11/17,2.二分检索算法,算法2.3 二分检索procedure BINSRCH(A,n,x,j)integer low,high,mid,j,n;low1;hig
5、hn;while lowhigh do mid case xA(mid):low mid+1 else:jmid;return endcase repeatend NIBSRCH,注:给定一个按非降次序排列的元素数组A(1:n),n1,判断x是否出现。若是,置j,使得x=A(j)若非,j=0,2023/11/17,例2.1:设A(1:9)=(-15,-6,0,7,9,23,54,82,101)在A中检索x=101,-14,82。执行轨迹见下表1,成功的检索,不成功的检索,成功的检索,2023/11/17,3.算法的正确性证明定理2.1 过程BINSRCH(A,n,x,j)能正确运行证明:1)在
6、具体指定A中的数据元素及x的数据类型后,算法中的所有运算都 能按要求正确运行即首先满足确定性和能行性2)终止性 算法初始部分置low1,highn 若n=0,不进入循环,j置0,算法终止 否则,进入循环,计算mid,或 x=A(mid),j置为mid,算法终止;或xA(mid),置lowmid+1,进入下次循环;搜索范围实际缩小 为mid+1,high,对low,mid-1区间不做进一步搜索;因low,high,mid都是整型变量,故按照上述规则,在有限步内,或找到某个mid,有A(mid)=x;或变得lowhigh,在A中没有找到任何元素等于x,算法终止。,2023/11/17,4.性能分析
7、,1)空间特性 n+5个空间位置(n)2)时间特性 区分以下情况,并进行相应的分析成功检索:所检索的x出现在A中。成功检索情况共有n种:x恰好是A中的某个元素,A中共有n个元素,故有n种可能的情况不成功检索:所检索的x不出现在A中。不成功检索情况共有n+1种:xA(n)成功/不成功检索的最好情况:执行步数最少,计算时间最短成功/不成功检索的最坏情况:执行步数最多,计算时间最长成功/不成功检索的平均情况:一般情况下的计算时间,2023/11/17,实例分析(例2.1),频率计数特征 while循环体外语句的频率计数为1 集中考虑while循环中的x与A中元素的比较(其它运算的频率计数与之有相同的
8、数量级)假定只需一次比较就可确定case语句控制是三种情况的哪一种。查找每个元素所需的元素比较次数统计如下:,A 元素-15-6 0 7 9 23 54 82 101成功检索比较次数 3 2 3 4 1 3 2 3 4 不成功检索比较次数 3 3 3 4 4 3 3 3 4 4,2023/11/17,成功检索 最好:1次 最坏:4次 平均:(3+2+3+4+1+3+2+3+4)/92.77次不成功检索 最好:3次 最坏:4次 平均:(3+3+3+4+4+3+3+3+4+4)/10=3.4次,2023/11/17,二元比较树,算法执行过程的主体是x与一系列中间元素A(mid)比较。可用一棵二元树
9、描述这一过程,并称之为二元比较树。构造:比较树由称为内结点和外结点的两种结点组成:内结点:表示一次元素比较,用圆形结点表示,存放一个mid值;代表一次成功检索;外结点:在二分检索算法中表示一种不成功检索的情况,用方形结点表示。路 径:表示一个元素的比较序列。,例2.1的二元比较树,2023/11/17,基于二元比较树的分析 若x在A中出现,则算法的执行过程在一个圆形的内结点处结束。若x不在A中出现,则算法的执行过程在一个方形的外结点处结束 外结点不代表元素的比较,因为比较过程在该外结点的上一级的内结点处结束。,例2.1的二元比较树,2023/11/17,定理2.2 若n在区域2k-1,2k)中
10、,则对于一次成功的检索,BINSRCH至多做k次比较;对于一次不成功的检索,或者做k-1次比较,或者做k次比较。证明:要点:成功检索都在内结点处结束,不成功检索都在外结点处结束 当2k-1n2k时,所有内结点在1至k级,所有外结点在第k-1级 或第k级,故:成功检索在i级终止所需要的元素比较次数是i 不成功检索在i级外部结点终止的元素比较次数是i-1,2023/11/17,BINSRCH计算复杂度的理论分析,1)不成功检索的最好、最坏和平均情况的计算时间均为 外结点处在最末的两级上;2)最好情况下的成功检索的计算时间为 最坏情况下的成功检索的计算时间为,2023/11/17,3)平均情况下的成
11、功检索的计算时间分析 利用外部结点和内部结点到根距离和之间的关系进行推导:记,由根到所有内结点的距离之和称为内部路径长度,记为I;由根到所有外部结点的距离之和称为外部路径长度,记为E。则有,E=I+2n 记,U(n)是平均情况下不成功检索的计算时间,则U(n)=E/(n+1)S(n)是平均情况下成功检索的计算时间,则S(n)=I/n+1 利用上述公式,可有:S(n)=(1+1/n)U(n)-1 当n,S(n)U(n),而U(n)=所以 S(n)=,2023/11/17,4.以比较为基础检索的时间下界,问题:设n个元素的数组A(1:n)有A(1)A(2)A(n)。检索一给定元素x是否在A中出现。
12、定理2.2给出了二分检索算法的时间下界,是否预计还存在有以元素比较为基础的另外的检索算法,它在最坏情况下比二分检索算法在计算时间上有更低的数量级?以比较为基础的算法:假定算法中只允许进行元素间的比较,而不允许对它们实施其它运算。,2023/11/17,注:每个内结点表示一次元素的比较。每棵比较树中恰好含有n个内结点,分别与n个不同i值相对应;每个外结点对应一次不成功的检索,并恰好又n+1个外结点对应于n+1中不成功检索的情况。,任何以比较为基础的检索算法,其执行过程都可以用二元比较树来描述。,2023/11/17,以比较为基础的有序检索问题最坏情况的时间下界定理2.3 设A(1:n)含有 n(
13、n1)个不同的元素,排序为A(1)A(2)A(n)。又设用以比较为基础的算法去判断是否,则这样的任何算法在最坏情况下所需的最小比较次数FIND(n)有:,证明:从模拟求解检索问题算法的比较树可知,FIND(n)不大于树中由根到一个叶子的最长路经的距离。而所有树中必定有n个内结点与x在A中的n中可能的出现相对应。如果一棵二元树的所有内结点所在的级数小于或等于k,则最多有2k-1个内结点。故n2k-1,即,2023/11/17,任何一种以比较为基础的算法,在最坏情况下的计算时间都不低于(logn)。因此,不可能存在最坏情况比二分检索数量级还低的算法。二分检索是解决检索问题的最优的最坏情况算法。,2
14、023/11/17,2.3 找最大和最小元素,问题描述:给定含有n个元素的集合,在其中找出最大和最小元素。,2023/11/17,1.直接找最大和最小元素算法2.5 直接找最大和最小元素procedure STRAITMAXMIN(A,n,max,min)/将A中的最大值置于max,最小值置于min/Integer i,n maxminA(1)for i2 to n do if A(i)max then maxA(i)endif if A(i)min then minA(i)endif repeatend STRAITMAXMIN,算法的性能:只考虑算法中的比较运算,以此代表算法的执行特征;该
15、算法最好、最坏、平均情况下均需要做2(n-1)次元素比较,2023/11/17,STRAITMAXMIN算法的一种简单改进形式:procedure STRAITMAXMIN1(A,n,max,min)integer i,n maxminA(1)for i2 to n do if A(i)max then maxA(i)endif else if A(i)min then minA(i)endif repeatend STRAITMAXMIN1这使得,最好情况:按递增次序排列,元素比较次数为n-1次最坏情况:按递减次序排列,元素比较次数为2(n-1)次平均情况:元素比较次数为3(n-1)/2次,
16、2023/11/17,2.分治求解策略 记问题的一个实例为:I=(n,A(1),A(n)采用二分法将I分成两个子集合处理 I1=(,A(1),,A(),和 I2=(n-,A(+1),,A(n)则有,MAX(I)=max(MAX(I1),MAX(I2)MIN(I)=min(MIN(I1),MIN(I2)采用递归的设计策略,得到以下算法:,2023/11/17,3.一种递归求解策略,算法2.6 递归求取最大和最小元素procedure MAXMIN(i,j,fmax,fmin)/A(1:n)是含有n个元素的数组,参数I,j是整数,1i,jn/该过程把A(i:n)中的最大和最小元素分别赋给max和m
17、in/integer i,j;global n,A(1:n)case:i=j:fmaxfminA(i)/只有一个元素:i=j-1:if A(i)A(j)then fmaxA(j);fminA(i)else fmaxA(i);fminA(j)/两个元素的情况 endif:else:mid/取中 call MAXMIN(i,mid,gmax,gmin)call MAXMIN(mid+1,j,hmax,hmin)fmaxmax(gmax,hmax);fminmin(gmin,hmin)end case end MAXMIN,2023/11/17,例:在A(1:9)=(22,13,-5,-8,15,6
18、0,17,31,47)上执行算法2.6,每个结点内的值分别是:i,j,fmax,fmin,递归调用,递归调用分解过程,递归调用的返回,2023/11/17,性能分析 0 n=1 T(n)=1 n=2 n2当n是2的幂时(n=2k),化简上式有,T(n)=2T(n/2)+2=2(2T(n/4)+2)+2=2k-1T(2)+=2k-1+2k-2=3n/2-2,2023/11/17,性能分析1)与STRAITMAXMIN算法相比,比较次数减少了25%(3n/2-2:2n-2)。已经达到了以元素比较为基础的找最大最小元素的算法 计算时间的下界:2)存在的问题:空间占用量大 有 级的递归,入栈参数:i,
19、j,fmax,fmin和返回地址五个值。时间可能不比预计的理想 如果元素A(i)和A(j)的比较与i和j的比较相差不大时,算法MAXMIN不可取。,2023/11/17,假设元素的比较与i和j的比较时间相同(整型数)。又设case语句中仅需一次i和j的比较就能够确定是哪种情况。记此时MAXMIN的频率计数为C(n),n=2k(k为正整数)。则有,2 n=2 C(n)=2C(n/2)+3 n2 化简得,C(n)=2C(n/2)+3=5n/2-3 按照同样的假设,重新估算STRAITMAXMIN算法的比较次数为:3(n-1)。考虑MAXMIN算法递归调用的开销,此时MAXMIN算法 的效率可能还不
20、如STRAITMAXMI算法。,2023/11/17,结论:如果A中的元素间的比较代价远比整型数(下标)的比较昂贵,则分治方法将产生 一个效率较高的算法;反之,可能仅得到一个低效的算法。故,分治策略只能看成一个较好的但并不总是成功 的算法设计指导。,2023/11/17,2.4 归并分类,1.分类问题排序 给定一n个元素的集合A,按照某种方法将A中的元素按非降或非增次序排列。分类:内排序,外排序 常见内排序方法:冒泡排序 插入排序 归并排序 快速排序 堆排序,2023/11/17,2.插入分类 算法2.7 插入分类 procedure INSERTIONSORT(A,n)/将A(1:n)中的元
21、素按非降次序分类,n1/A(0)-/设置初始边界值 for j2 to n do/A(1:j-1)已分类/itemA(j);ij-1 while itemA(i)do/0ij/A(i+1)A(i);ii-1 repeat A(i+1)item;repeat end INSERTIONSORT,2023/11/17,性能分析:最坏情况:输入数据按非增次序排列,每次内层while循环执行j次(j=2,3,n)。则有,最好情况:输入数据已按非降序排列,不进入while循环,则最好情况下计算时间为(n),2023/11/17,3.分治策略求解 基本设计思想:将原始数组A中的元素分成两个子集合:A1(1
22、:)和A2(+1:n)。分别对这两个子集合单独分类,然后将已分类的两个子序列归并成一个含有n个元素的分类好的序列。这样的一个分类过程称为归并分类。,2023/11/17,算法2.8 归并分类 procedure MERGESORT(low,high)/A(low:high)是一个全程数组,它含有high-low+10个待分类的元素/integer low,high if lowhigh then mid/计算中分点/call MERGESORT(low,mid)/在第一个子集合上分类(递归)/call MERGESORT(mid+1,high)/在第二个子集合上分类(递归)/call MERG
23、E(low,mid,high)/归并已分类的两子集合/endif end MERGESORT,2023/11/17,算法2.9 使用辅助数组归并两个已分类的集合 procedure MERGE(low,mid,high)/A(low,high)是一个全程数组,它含有两个放在A(low,mid)和A(mid+1,high)中的已分 类的子集合.目标是将这两个已分类的集合归并成一个集合,并存放到A(low,high)中/integer h,I,j,k,low,mid,high;/lowmidhigh/global A(low,high);local B(low,high)hlow;ilow;jmi
24、d+1;while hmid and jhigh do/当两个集合都没有取尽时,将较小的元素先存放到B中/if A(h)A(j)then B(i)A(h);hh+1/如果前一个数组中的元素较小/else B(i)A(j);jj+1/如果后一个数组中的元素较小/endif repeat/处理尚有剩余元素的集合/if hmid then for kj to high do B(i)A(k);ii+1;repeat else for kh to mid do B(i)A(k);ii+1;repeat endif for k low to high do A(k)B(k)repeat/将已归并的集合复
25、制到A中/end MERGE,2023/11/17,性能分析1)过程MERGE的归并时间与两数组元素的总数成正比(可表示为:cn,n为元素数,c为某正常数)2)过程MERGESORT的分类时间用递推关系式表示如下:a n=1,a是常数 T(n)=2T(n/2)+cn n1,c是常数化简:若n=2k,则有,T(n)=2(2T(n/4)+cn/2)+cn=4T(n/4)+2cn=4T(2T(n/8)+cn/4)+2cn=2kT(1)+kcn=an+cnlogn/k=logn/若2kn2k+1,则有T(n)T(2k+1)。所以得:T(n)=(nlogn),2023/11/17,归并分类示例,设A=(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 算法 基础 第二
链接地址:https://www.31ppt.com/p-6606589.html