《数据结构(C++版)(第二版)》第10章.ppt
《《数据结构(C++版)(第二版)》第10章.ppt》由会员分享,可在线阅读,更多相关《《数据结构(C++版)(第二版)》第10章.ppt(20页珍藏版)》请在三一办公上搜索。
1、2023/5/30,1,第10章 外排序,本章学习内容,10.1 外排序的基本概念,10.2 多路平衡归并的实现,2023/5/30,2,10.1 外排序的基本概念,内排序是直接在计算机内存中进行的。若要排序的数据一次可以装入计算机内存,则对这批数据的排序可以直接在内存中完成,因而,利用前面的内排序就可以了。若要排序的数据量很大,内存中一次装不下,要将数据放入外存(磁带、磁盘),这时,用内排序达不到我们的要求,必须用到本章介绍的外排序。而外排序是利用内存、外存来共同完成的。,外排序可以看成由两个独立的阶段组成。首先,按可用内存的大小,将外存上含n个记录的文件分成若干长度为m的子文件或段,依次读
2、入内存并用上一章的内排序方法(一般用堆排序实现)完成每段的排序,再保存到外存;然后,对这些段进行归并,使归并段逐渐由小到大,直到得到整个文件有序为止。第一阶段就是上一章介绍的内排序方法,因此,本章主要讨论第二阶段的归并实现。,第二阶段的归并有二路平衡归并和多路平衡归并。下面先给出例子来说明,具体实现方法见下一节。,2023/5/30,3,假设有一个含10000个记录的文件,内存一次只能装入1000个记录,则可以将文件分成10段,每段含1000个记录。首先通过10次内部排序得到10个初始归并段R1R10,其中每一段都含有1000个记录(已经有序),再保存到外存中,然后可以利用二路平衡归并使整个文
3、件有序。二路平衡归并见图10-1。,图10-1 二路平衡归并过程,2023/5/30,4,若对刚才的文件,首先通过10次内部排序得到10个初始归并段R1R10,其中每一段都含有1000个记录,再保存到外存中,然后也可以利用五路平衡归并使整个文件有序,五路平衡归并见图10-2。,图10-2 五路平衡归并过程,2023/5/30,5,一般情况下,外排序所需总的时间=内排序所需时间(生成初始归并段)m*tIS+外存信息读写的时间d*tIO+平衡归并所需的时间s*utmg。,m为初始归并段的个数,tIS是得到一个初始归并段进行内排序所需的时间均值;d为总的读写次数,tIO是进行一次外存读写时间的均值;
4、s为归并的趟数,utmg是对u个记录进行内部归并所需时间。,对同一文件而言,假设有m个初始归并段,进行k路平衡归并,归并的趟数可以表示为s=logkm。若增加k或减少m则可以减少s,外排序所需总的时间就可以减少。,2023/5/30,6,10.2 多路平衡归并的实现,10.2.1 初始归并段的生成,假设初始待排文件为输入文件FI,初始归并段文件为输出文件FO,内存工作区为WA,FO和WA的初始状态为空,并假设内存工作区WA的容量为W个记录,则生成初始归并段的操作过程为:,(1)从FI输入W个记录到工作区WA。(2)从WA中选关键字最小的记录,记为MINKEY。(3)将MINKEY记录输出到FO
5、中。(4)若FI不空,则从FI输入下一个记录到WA中。(5)从WA中选比MINKEY大的所有关键字中选最小的关键字,作为新的MINKEY。(6)重复(3)(5),直到WA中选不出新的MINKEY为止,由此得到一个初始归并段。(7)重复(2)(6)直到WA为空。则得到全部初始归并段。,例如,给定初始文件含有24个记录,对应的关键字分别为:51,49,39,46,38,29,14,61,15,30,1,48,52,3,63,27,4,13,89,24,46,58,33,76。利用上面的方法生成初始归并段过程如下表(假设内存工作区WA的容量为6个记录)。,2023/5/30,7,表10-1 生成初始
6、归并段,2023/5/30,8,表10-1 生成初始归并段(续),2023/5/30,9,表10-1 生成初始归并段(续),2023/5/30,10,从表10-1可知,上面的24个记录可以生成三个初始归并段分别为:,第一归并段R0:29,38,39,46,49,51,61第二归并段R1:1,3,14,15,27,30,48,52,63,89第三归并段R2:4,13,24,33,46,58,76,上面的三个初始归并段都是有序序列,故可以用二路平衡归并进行排序或用三路平衡归并进行排序。,若用二路平衡归并,可以得到如下结果:,29,38,39,46,49,51,61 1,3,14,15,27,30,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据结构C+版第二版 数据结构 C+ 第二 10
链接地址:https://www.31ppt.com/p-5030408.html