数据结构第10章内部排序.ppt
《数据结构第10章内部排序.ppt》由会员分享,可在线阅读,更多相关《数据结构第10章内部排序.ppt(107页珍藏版)》请在三一办公上搜索。
1、1,数据结构课程的内容,2,10.1 概述10.2 插入排序10.3 交换排序10.4 选择排序10.5 归并排序10.6 基数排序,第10章 内部排序,3,10.1 概述,1.什么是排序?将一组杂乱无章的数据按一定的规律顺次排列起来。,2.排序的目的是什么?,存放在数据表中,按关键字排序,3.排序算法的好坏如何衡量?时间效率排序速度(即排序所花费的全部比较次数)空间效率占内存辅助空间的大小稳定性若两个记录A和B的关键字值相等,但排序后A、B的先后次序保持不变,则称这种排序算法是稳定的。,便于查找!,4,4.什么叫内部排序?什么叫外部排序?,若待排序记录都在内存中,称为内部排序;若待排序记录一
2、部分在内存,一部分在外存,则称为外部排序。,注:外部排序时,要将数据分批调入内存来排序,中间结果还要及时放入外存,显然外部排序要复杂得多。,5.待排序记录在内存中怎样存储和处理?,顺序排序排序时直接移动记录;链表排序排序时只移动指针;地址排序排序时先移动地址,最后再移动记录。,注:地址排序中可以增设一维数组来专门存放记录的地址。,5,注:大多数排序算法都是针对顺序表结构的(便于直接移动元素),6.顺序存储(顺序表)的抽象数据类型如何表示?,Typedef struct/定义每个记录(数据元素)的结构 KeyType key;/关键字 InfoType otherinfo;/其它数据项Recor
3、dType;,#define MAXSIZE 20/设记录不超过20个typedef int KeyType;/设关键字为整型量(int型),Typedef struct/定义顺序表的结构 RecordType r MAXSIZE+1;/存储顺序表的向量,r0一般作哨兵或缓冲区 int length;/顺序表的长度SqList;,6,7.内部排序的算法有哪些?,按排序的规则不同,可分为5类:插入排序交换排序(重点是快速排序)选择排序归并排序基数排序,d关键字的位数(长度),按排序算法的时间复杂度不同,可分为3类:简单的排序算法:时间效率低,O(n2)先进的排序算法:时间效率高,O(nlog2n
4、)基数排序算算法:时间效率高,O(dn),7,10.2 插入排序,插入排序的基本思想是:,每步将一个待排序的对象,按其关键字大小,插入到前面已经排好序的一组对象的适当位置上,直到对象全部插入为止。,插入排序的基本操作:将记录Ri插入到有序子序列R1.i-1中,使记录的有序序列从R1.i-1变为R1.i。,显然,完成这个“插入”需分三步进行:1查找Ri的插入位置j+1;2将Rj+1.i-1中的记录后移一个位置;3将Ri复制到Rj+1的位置上。,8,10.2 插入排序,插入排序有多种具体实现算法:1)直接插入排序 2)折半插入排序 3)表插入排序 4)希尔排序,简言之,边插入边排序,保证子序列中随
5、时都是排好序的。,9,1)直接插入排序,新元素插入到哪里?,例1:关键字序列T=(13,6,3,31,9,27,5,11),请写出直接插入排序的中间过程序列。,【13】,6,3,31,9,27,5,11【6,13】,3,31,9,27,5,11【3,6,13】,31,9,27,5,11【3,6,13,31】,9,27,5,11【3,6,9,13,31】,27,5,11【3,6,9,13,27,31】,5,11【3,5,6,9,13,27,31】,11【3,5,6,9,11,13,27,31】,在已形成的有序表中线性查找,并在适当位置插入,把原来位置上的元素向后顺移。,最简单的排序法!,10,例
6、2:关键字序列T=(21,25,49,25*,16,08),请写出直接插入排序的具体实现过程。,*表示后一个25,i=1,21,i=2,i=3,i=5,i=4,i=6,25,25,25,49,49,49,25*,49,16,16,08,49,解:假设该序列已存入一维数组V7中,将V0作为缓冲或暂存单元(Temp)。则程序执行过程为:,初态:,16,25,21,16,完成!,时间效率:O(n2)因为在最坏情况下,所有元素的比较次数总和为(01n-1)O(n2)。其他情况下还要加上移动元素的次数。空间效率:O(1)因为仅占用1个缓冲单元算法的稳定性:稳定因为25*排序后仍然在25的后面。,11,直
7、接插入排序算法的三个要点:,1从Ri-1起向前顺序查找,监视哨设置在R0R0=Ri;/设置“哨兵”for(j=i-1;R0.keyRj.key;-j);/从后往前找return j+1;/返回Ri的插入位置为j+12对于在查找过程中找到的关键字不小于Ri.key的记录,在查找的同时实现记录向后移动;for(j=i-1;R0.keyRj.key;-j)Rj+1=Rj3i=2,3,,n,实现整个序列的排序。,12,直接插入排序算法描述如下:void InserSort(SqList/插入到正确位置/InsertSort,13,若设待排序的对象个数为n,则算法需要进行n-1次插入。最好情况下,排序前
8、对象已经按关键字大小从小到大有序,每趟只需与前面的有序对象序列的最后一个对象的关键字比较 1 次。因此,总的关键字比较次数为n-1。,直接插入排序的算法分析,14,最坏情况下,第i趟插入时,第i个对象必须与前面i-1个对象都做关键字比较,并且每做 1 次比较就要做 1 次数据移动。则总的关键字比较次数KCN和对象移动次数RMN分别为,15,若待排序对象序列中出现各种可能排列的概率相同,则可取上述最好情况和最坏情况的平均情况。在平均情况下的关键字比较次数和对象移动次数约为 n2/4。因此,直接插入排序的时间复杂度为 o(n2)。直接插入排序是一种稳定的排序方法。,16,2)折半插入排序,优点:比
9、较的次数大大减少,全部元素比较次数仅为O(nlog2n)。时间效率:虽然比较次数大大减少,可惜移动次数并未减少,所以排序效率仍为O(n2)。空间效率:O(1)稳定性:稳定,当待排序记录的数量n很小时,直接插入排序是一种简便的方法;但当记录数量n很大时,则不宜采用直接插入排序。由于插入排序的基本操作是在有序表R1.i-1中进行查找和插入的;则可以利用折半查找实现“在R1.i-1中查找Ri的插入位置”,并在适当位置插入,把原来位置上的元素向后顺移。如此实现的插入排序为折半插入排序。,17,折半插入排序算法描述如下:void BInserSort(SqList/插入/for/BInsertSort,
10、18,讨论:若记录是链表结构,用直接插入排序行否?折半插入排序呢?答:直接插入不仅可行,而且还无需移动元素,时间效率更高!,折半插入排序的改进2-路插入排序见教材P267。,但链表无法“折半”!,19,折半插入排序的算法分析,折半查找比顺序查找快,所以折半插入排序就平均性能来说比直接插入排序要快。在插入第 i 个对象时,需要经过 log2i+1 次关键字比较,才能确定它应插入的位置。因此,将 n 个对象用折半插入排序所进行的关键字比较次数为:n*log2n折半插入排序是一个稳定的排序方法。,20,3)表插入排序,基本思想:在顺序存储结构中,给每个记录增开一个指针分量,在排序过程中将指针内容逐个
11、修改为已经整理(排序)过的后继记录地址。优点:在排序过程中不移动元素,只修改指针。,回忆:链表排序排序时只移动指针;地址排序排序时先移动地址,最后再移动记录。,此方法具有链表排序和地址排序的特点。,21,1,例:关键字序列 T=(21,25,49,25*,16,08),请写出表插入排序的具体实现过程。,解:假设该序列(结构类型)已存入有序链表SL7中,将SL0作为表头结点。则算法执行过程为:,指向第1个元素,指向头结点,初态i=1,i=2,i=3,i=4,i=5,i=6,0,3,4,5,6,5,0,3,1,0,2,*表示后一个25,静态链表,22,表插入排序算法分析:,无需移动记录,只需修改2
12、n次指针值。但由于比较次数没有减少,故时间效率仍为O(n2)。空间效率肯定低,因为增开了指针分量(但在运算过程中没有用到更多的辅助单元)。稳定性:25和25*排序前后次序未变,稳定。讨论:此算法得到的只是一个有序链表,查找记录时只能满足顺序查找方式。改进:可以根据表中指针线索,很快对所有记录重排,形成真正的有序表(顺序存储方式),从而能满足折半查找方式。具体实现见教材P269。,23,4)希尔(shell)排序(又称缩小增量排序),基本思想:先将整个待排记录序列分割成若干子序列,分别进行直接插入排序,待整个序列中的记录“基本有序”时,再对全体记录进行一次直接插入排序。技巧:子序列的构成不是简单
13、地“逐段分割”,而是将相隔某个增量dk的记录组成一个子序列,让增量dk逐趟缩短(例如依次取5,3,1),直到dk1为止。优点:让关键字值小的元素能很快前移,且序列若基本有序时,再用直接插入排序处理,时间效率会高很多。,24,38,例:关键字序列 T=(49,38,65,97,76,13,27,49*,55,04),请写出希尔排序的具体实现过程。,初态:,第1趟(dk=5),第2趟(dk=3),第3趟(dk=1),49,13,13,49,38,27,65,49*,97,55,76,04,27,38,65,49*,97,55,13,55,76,04,55,13,27,04,27,04,49,49*
14、,49,49*,76,38,76,65,65,97,97,13,27,04,49*,76,97,算法分析:开始时dk 的值较大,子序列中的对象较少,排序速度较快;随着排序进展,dk 值逐渐变小,子序列中对象个数逐渐变多,由于前面工作的基础,大多数对象已基本有序,所以排序速度仍然很快。,ri,问题:第三趟(dk=1)的排序过程与在初态序列上直接进行dk=1排序是否相同?,25,void ShellSort(SqList&L,int dlta,int t)/按增量序列dlta0t-1对顺序表L作Shell排序 for(k=0;kt;+k)ShellInsert(L,dltak);/增量为dltak
15、的一趟插入排序/ShellSort,时间效率:,空间效率:O(1)因为仅占用1个缓冲单元算法的稳定性:不稳定因为49*排序后却到了49的前面,希尔排序算法(主程序),参见教材P272,O(n1.3)经验公式,dk值依次装在dltat中,26,void ShellInsert(SqList j=j-dk)L.rj+dk=L.rj;L.rj+dk=L.r0;,希尔排序算法(其中某一趟的排序操作),参见教材P272,/对顺序表L进行一趟增量为dk的Shell排序,dk为步长因子,/开始将ri 插入有序增量子表,/暂存在r0,/关键字较大的记录在子表中后移,/在本趟结束时将ri插入到正确位置,27,课
16、堂练习:,1.欲将序列(Q,H,C,Y,P,A,M,S,R,D,F,X)中的关键字按字母升序重排,则初始步长为4的希尔排序一趟的结果是?答:原始序列:Q,H,C,Y,P,A,M,S,R,D,F,X shell一趟后:,28,2.以关键字序列(256,301,751,129,937,863,742,694,076,438)为例,分别写出执行以下算法的各趟排序结束时,关键字序列的状态,并说明这些排序方法中,哪些易于在链表(包括各种单、双、循环链表)上实现?直接插入排序 希尔排序(取dk=5,3,1),答:显然,直接插入排序方法易于在链表上实现;但希尔排序方法因为是按增量选择记录,不易于在链表上实现
17、。两种排序方法的中间状态分别描述如后:,29,原始序列:256,301,751,129,937,863,742,694,076,438,256,301,751,129,937,863,742,694,076,438256,301,751,129,937,863,742,694,076,438129,256,301,751,937,863,742,694,076,438129,256,301,751,937,863,742,694,076,438129,256,301,751,863,937,742,694,076,438129,256,301,742,751,863,937,694,076,4
18、38129,256,301,694,742,751,863,937,076,438076,129,256,301,694,742,751,863,937,438076,129,256,301,438,694,742,751,863,937,直接插入排序,第1趟第2趟第3趟第4趟第5趟第6趟第7趟第8趟第9趟,30,原始序列:256,301,751,129,937,863,742,694,076,438,希尔排序,(取dk=5,3,1),256,301,751,129,937,863,742,694,076,438,256,301,751,129,937,863,742,694,076,438,
19、256,301,694,129,937,863,742,751,076,438,256,301,694,076,937,863,742,751,129,438,256,301,694,076,438,863,742,751,129,937,第1趟dk=5第2趟dk=3第3趟dk=1,256,301,694,076,438,863,742,751,129,937,256,301,694,076,438,863,742,751,129,937,076,301,694,256,438,863,742,751,129,937,076,301,694,256,438,863,742,751,129,93
20、7,076,301,694,256,438,863,742,751,129,937,076,301,129,256,438,694,742,751,863,937,076,301,129,256,438,694,742,751,863,937,076,301,129,256,438,694,742,751,863,937,076,129,256,301,438,694,742,751,863,937,31,10.3 快速排序,两两比较待排序记录的关键字,如果发生逆序(即排列顺序与排序后的次序正好相反),则交换之,直到所有记录都排好序为止。,快速排序的主要算法有:1)冒泡排序 2)快速排序,快速
21、排序的基本思想是:,32,1)冒泡排序,基本思路:每趟不断将记录两两比较,并按“前小后大”(或“前大后小”)规则交换。优点:每趟结束时,不仅能挤出一个最大值到最后面位置,还能同时部分理顺其他元素;一旦下趟没有交换发生,还可以提前结束排序。前提:顺序存储结构,例:关键字序列 T=(21,25,49,25*,16,08),请写出冒泡排序的具体实现过程。(假设“前小后大”),21,25,49,25*,16,0821,25,25*,16,08,4921,25,16,08,25*,4921,16,08,25,25*,4916,08,21,25,25*,4908,16,21,25,25*,49,初态:第1
22、趟第2趟第3趟第4趟第5趟,33,冒泡排序的算法分析,时间效率:O(n2)因为要考虑最坏情况空间效率:O(1)只在交换时用到一个缓冲单元稳 定 性:稳定 25和25*在排序前后的次序未改变,详细分析:最好情况:初始排列已经有序,只执行一趟起泡,做 n-1 次关键字比较,不移动对象。最坏情形:初始排列逆序,算法要执行n-1趟起泡,第i趟(1 i n)做了n-i 次关键字比较,执行了n-i 次对象交换。此时的比较总次数KCN和记录移动次数RMN为:,34,2)快速排序,从待排序列中任取一个元素(例如取第一个)作为中心,所有比它小的元素一律前放,所有比它大的元素一律后放,形成左右两个子表;然后再对各
23、子表重新选择中心元素并依此规则调整,直到每个子表的元素只剩一个。此时便为有序序列了。,基本思想:,优点:因为每趟可以确定不止一个元素的位置,而且呈指数增加,所以特别快!前提:顺序存储结构,35,(),,设以首元素为枢轴中心,例1:关键字序列 T=(21,25,49,25*,16,08),请写出快速排序的算法步骤。,21,25,49,25*,16,08,初态:第1趟:第2趟:第3趟:,讨论:1.这种不断划分子表的过程,计算机如何自动实现?2.“快速排序”是否真的比任何排序算法都快?,08,16,21,25,25*,(49),21,16,08,,(),25,25*,49,(08),16,21,,2
24、5,(25*,49),36,1.这种不断划分子表的过程,计算机如何自动实现?,编程时:每一趟的子表的形成是采用从两头向中间交替式逼近法;由于每趟中对各子表的操作都相似,主程序可采用递归算法。,见教材P275,int Partition(SqList/取枢轴的关键字存入pivotkey变量(续下页),一趟快速排序算法(针对一个子表的操作),37,while(low=pivotkey)-high;L.rlowL.rhigh;/将比枢轴小的记录交换到低端 while(lowhigh/将比枢轴大的记录交换到高端,return low;/返回枢轴记录所在位置。/Partition,38,Low=high
25、=3,本趟停止,将支点定位并返回位置信息,例2:关键字序列 T=(21,25,49,25*,16,08),请写出快速排序算法的一趟实现过程。,high,low,21,08,25,16,49,25*,3,21,pivotkey=21,08,25,16,49,(08,16)21(25*,49,25),25*跑到了前面,不稳定!,39,j从高端扫描寻找小于pivot的元素,i从低端扫描寻找大于pivot的元素,一趟快速排序算法流程图,40,void QSort(SqList,整个快速排序的递归算法:,见教材P276,/长度1,/对顺序表L中的子序列r lowhigh 作快速排序,/QSort,voi
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据结构 10 内部 排序
链接地址:https://www.31ppt.com/p-6296869.html