《数据结构教学课件》第11章.ppt
《《数据结构教学课件》第11章.ppt》由会员分享,可在线阅读,更多相关《《数据结构教学课件》第11章.ppt(151页珍藏版)》请在三一办公上搜索。
1、第11章 查找,查找的基本概念静态查找表动态查找表哈希表,主要知识点,11.1 查找的基本概念,是指在数据集合中查询是否存在关键字等于某个给定关键字的数据元素的过程。亦称作检索。,主关键字,次关键字,能够惟一区分各个不同数据元素,通常不能惟一区分各个不同数据元素,查找结果,查找成功,查找不成功,查找概念,11.1 查找的基本概念,是指在数据集合中查询是否存在关键字等于某个给定关键字的数据元素的过程。亦称作检索。,查找表,查找概念,以集合为逻辑结构、以查找为核心运算、包括其他运算的数据结构,静态查找:只查找,不改变数据元素集合内的数据元素。动态查找:既查找,又改变(增减)集合内的数据元素。,查找
2、分类,静态查找表,动态查找表,查找表的存储结构是否发生变化,平均查找长度:查找过程所需进行的关键字比较次数的平均值,其数学定义为:,查找算法效率,该指标是衡量查找算法效率的最主要标准,查找的第i个数据元素出现的概率,查找的第i个数据元素所需的关键字比较次数,成功的平均查找长度,查找数据元素,一个数据,数据类型是自定义的结构类型,typedef structint num;char name20;char sex;DataType;,定义要查找数据元素的结构体为:typedef struct KeyType key;DataType;,11.2 静态查找表,静态查找表主要有三种结构:顺序表 有序
3、顺序表 索引顺序表,1.顺序表,在顺序表上查找的基本思想是:从顺序表的一端开始,用给定数据元素的关键字逐个和顺序表中各数据元素的关键字比较,若在顺序表中查找到要查找的数据元素,则查找成功,函数返回该数据元素在顺序表中的位置;否则查找失败,函数返回-1。,list,size=6,MaxSize-1,0,1,2,3,4,5,6,a0,a1,a2,a3,a4,a5,#include“SeqList.h”int SeqSearch(SeqList S,DataTye x)int i=0;while(i S.size,查找函数设计如下(顺序表):,结构数组,结构数组中某个元素的某个成员,查找函数设计如下
4、(数组):int SeqSearch(DataType a,int n,KeyType key)int i=0;while(i n,查找成功时的平均查找长度ASL为:第1个元素查找成功需要比较的次数为1;第2个元素查找成功需要比较的次数为2;第3个元素查找成功需要比较的次数为3;:第n个元素查找成功需要比较的次数为n;,2.有序顺序表,有序顺序表上的查找算法主要有顺序查找和折半查找两种方法。,一、顺序查找 有序顺序表上的顺序查找算法和顺序表上的查找算法方法类同,二、二分查找(又称折半查找),算法的基本思想:先给数据排序(例如按升序排好),形成有序表,然后再将key与正中元素值相比,若key小,
5、则缩小至前半部内查找;再取其中值比较,每次缩小1/2的范围,直到查找成功或失败为止。反之,如果key大,则缩小至后半部内查找。,int BinarySearch(SeqList S,DataType x)int low=0,high=n-1;/确定初始查找区间上下界 int mid;while(low=high)mid=(low+high)/2;/确定查找区间中心下标 if(S.listmid.key=x.key)return mid;/查找成功 else if(S.listmid.key x.key)low=mid+1;else high=mid-1;return-1;/查找失败,二分查找算
6、法如下:,算法效率分析,平均查找长度ASL为:,1次比较就查找成功的元素有1个(20),即中间值;2次比较就查找成功的元素有2个(21),即1/4处(或3/4)处;3次比较就查找成功的元素有4个(22),即1/8处(或3/8)处 4次比较就查找成功的元素有8个(23),即1/16处(或3/16)处 则第m次比较时查找成功的元素会有(2m-1)个;为方便起见,假设表中全部n个元素 2m-1个,此时就不讨论第m次比较后还有剩余元素的情况了。,3.索引顺序表,当顺序表中的数据元素个数非常大时,采用在顺序表上建立索引表的办法提高查找速度。把要在其上建立索引表的顺序表称作主表。主表中存放着数据元素的全部
7、信息,索引表中只存放主表中要查找数据元素的主关键字和索引信息。,顺序表,有序顺序表,当表很长时,效率都不高,这是一种顺序查找的另一种改进方法。先让数据分块有序,即分成若干子表,要求每个子表中的数值(用关键字更准确)都比后一块中数值小(但子表内部未必有序)。然后将各子表中的最大关键字构成一个索引表,表中还要包含每个子表的起始地址(即头指针)。,索引表,最大关键字,起始地址,第1块,第2块,第3块,22,48,86,例:,特点:块间有序,块内无序,位置0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17,索引表中的数据元素由两个域构成,key域为被索引的若干个数据
8、元素中关键字的最大值,link域为被索引的若干个数据元素中第一个数据元素的位置编号。,索引表结构图,查找步骤分两步进行:对索引表使用折半查找法(因为索引表是有序表);确定了待查关键字所在的子表后,在子表内采用顺序查找法(因为各子表内部是无序表);,查找效率:ASL=Lb+Lw,对索引表查找的ASL,对块内查找的ASL,S为每块内部的记录个数,n/s即块的数目,例如当n=9,s=3时,ASLbs=3.5,而折半法为3.1,顺序法为5,假设索引表的长度为m,主表中每个子表的长度为s,并假设在索引表上和在主表上均采用顺序查找算法,则索引顺序表上查找算法的平均查找长度为:,算法分析,完全索引表:和主表
9、项完全相同,但只包含索引关键字和该数 据元素在主表中位置信息的索引表二级索引表:当主表中的数据元素个数非常庞大时,按照建立索引表的同样方法对索引表再建立的索引表。二级以上的索引结构称作多级索引结构等长索引表:索引表中的每个索引项对应主表中的数据元素个数相等;反之称为不等长索引表。不等长索引表中的索引长度可随着动态插入和动态删除过程改变,因此不仅适用于静态查找问题,而且也适用于动态查找问题。,相关术语,11.3 动态查找表,动态查找表主要有二叉树结构和树结构两种类型。二叉树结构有二叉排序树、平衡二叉树等。树结构有B-树、B+树等。,11.3.1 二叉排序树和平衡二叉树,一、基本概念,二叉排序树或
10、是一棵空树;或者是具有如下性质的非空二叉树:(1)左子树的所有结点均小于根的值;(2)右子树的所有结点均大于根的值;(3)它的左右子树也分别为二叉排序树。,下图所示就是一棵二叉排序树,根结点,左子树,右子树,二叉排序树中结点的结构体定义如下:typedef struct node DataType data;struct node*leftChild;struct node*rightChild;BiTreeNode;,二、二叉排序树的查找算法,int Search(BiTreeNode*root,DataType item)BiTreeNode*p;if(root!=NULL)p=root;
11、while(p!=NULL)if(p-data.key=item.key)return 1;if(item.key p-data.key)p=p-rightChild;else p=p-leftChild;return 0;,思想:先在根结点中找;再根据待查关键字和根结点 中关键字的大小,选在到左 子树或右子树中去找;直到结点不存在,三、插入算法,插入操作要求首先查找数据元素是否在二叉排序树中存在,若存在则返回;若不存在,插入查找失败时结点的左指针或右指针上。所插新结点一定在叶结点上。,思想:先查找 如果找到,则还回标记成功标记,如0;如果没有找到,插入;插入就是将新建的结点作为当前结点的左孩
12、子或右 孩子,三、插入算法,root,查找item.key=40,curr,curr,curr,三、插入算法,root,查找item.key=33,curr,curr,curr,curr,curr,插入处,三、插入算法,root,查找item.key=33,curr,curr,curr,curr,curr,parent,parent,parent,parent,33,p,int Insert(BiTreeNode*root,DataType item)BiTreeNode*current,*parent=NULL,*p;current=*root;while(current!=NULL)if(
13、current-data.key=item.key)return 0;parent=current;if(current-data.key rightChild;else current=current-leftChild;/*生成新结点*/p=(BiTreeNode*)malloc(sizeof(BiTreeNode);p-data=item;p-leftChild=NULL;p-rightChild=NULL;if(parent=NULL)*root=p;else if(item.key data.key)parent-leftChild=p;else parent-rightChild=
14、p;return 1;,下图是调用上述插入函数依次插入数据元素4,5,7,2,1,9,8,11,3的过程。,五、删除算法,删除操作要求首先查找数据元素是否在二叉排序树中存在,若不存在则结束;存在的情况及相应的删除方法有如下四种:(1)要删除结点无孩子结点,直接删除该结点。(2)要删除结点只有左孩子结点,删除该结点且使被删除结点的双亲结点指向被删除结点的左孩子结点。(3)要删除结点只有右孩子结点,删除该结点且使被删除结点的双亲结点指向被删除结点的右孩子结点。(4)要删除结点有左右孩子结点,分如下三步完成:首先寻找数据元素的关键字值大于要删除结点数据元素关键字的最小值,即寻找要删除结点右子树的最左
15、结点;然后把右子树的最左结点的数据元素值拷贝到要删除的结点上;最后删除右子树的最左结点。,删除过程分别如图所示,30,重复删除操作,删除红色结点,例11-2 设计一个测试二叉排序树的主函数。#include#include#include typedef int KeyType;typedef struct KeyType key;DataType;typedef struct node DataType data;struct node*leftChild;struct node*rightChild;BiTreeNode;#include“BiSortTree.h”,void InTrav
16、erse(BiTreeNode*root)/*中序遍历显示二叉排序树结点信息函数*/if(root=NULL)return;if(root-leftChild!=NULL)InTraverse(root-leftChild);printf(%d,root-data.key);if(root-rightChild!=NULL)InTraverse(root-rightChild);,void main(void)DataType test=4,5,7,2,1,9,8,11,3,x=9;int n=9,i,s;BiTreeNode*root=NULL;for(i=0;i n;i+)Insert(,
17、程序运行建立的二叉排序树如图11-5(i)所示。程序运行结果如下:1 2 3 4 5 7 8 9 11 数据元素9存在!,六、二叉排序树的性能分析,一棵二叉排序树的平均查找长度为:,其中:C(i)为查找第i个数据元素时的关键字比较次数,当二叉排序树是一棵完全二叉树时,二叉排序树的平均查找长度为:,当二叉排序树是一棵单分支退化树时,则平均查找长度就和有序顺序表的平均查找长度相同,即为:,(a)满二叉排序树时,k=log2(7+1)=3,所以查找成功的平均查找长度为:,(b)左分支退化二叉排序树时,k=n=7,所以查找成功的平均查找长度为:,在最坏情况下,二叉排序树的平均查找长度为O(n)。在一般
18、情况下,二叉排序树的平均查找长度为O(log2n)。,平衡二叉树或者是一棵空树,或者是具有这样性质的二叉排序树:它的左子树和右子树都是二叉排序树,并且左子树和右子树的深度之差的绝对值不超过1。基本方法:就是在构造二叉排序树的基础上,每当如果插入了一个新结点后,使二叉树中某个结点的左子树和右子树的深度之差的绝对值超过1,则调整相应的二叉树,使二叉树中该结点的左子树和右子树的深度之差的绝对值不超过1。特点:平衡二叉树一定不会出现单分支退化二叉排序树那样的情况,因此,平衡二叉树的平均查找长度为O(lbn)。但相对二叉排序树来说,构造平衡二叉树需要花费较多的时间,而且删除平衡二叉树中某个结点时,也要考
19、虑删除某个结点后,平衡二叉树中某个结点的左子树和右子树的深度之差的绝对值不能超过1。,七、平衡二叉树,1 B_树,B_树是一种平衡多叉排序树。平衡是指所有叶结点都在同一层上,从而可避免出现像二叉排序树那样的分支退化现象。因此B_树的动态查找效率更高。,B_树中所有结点的孩子结点个数的最大值称为B_树的阶,,11.3.2 B_树和B+树,(1)树中每个结点至多有m个孩子结点。(2)除根结点外,其他结点至少有m/2个孩子结点(符号“”表示上取整)。(3)若根结点不是叶结点,则根结点至少有两个孩子结点;(4)每个结点的结构为:,(5)所有叶结点都在同一层上。,一棵m阶的B_树或者是一棵空树,或者是满
20、足下列要求的m叉树:,结点关键字个数,结点孩子指针,关键字的值,(1)树中每个结点至多有m个孩子结点。(2)除根结点外,其他结点至少有m/2个孩子结点(符号“”表示上取整)。(3)若根结点不是叶结点,则根结点至少有两个孩子结点;(4)每个结点的结构为:,(5)所有叶结点都在同一层上。,一棵m阶的B_树或者是一棵空树,或者是满足下列要求的m叉树:,一棵4阶B_树,2个孩子,3个孩子,4个孩子,B_树的查找算法,在B_树上查找数据元素x的方法为:将 x.key与根结点的Ki逐个进行比较:(1)若x.key=Ki,则查找成功。(2)若keyKn,则沿着指针Pn所指的子树继续查找。,例子,查找key=
21、30?,curr,curr,curr,例子,查找key=32?,curr,curr,curr,curr,插入过程分两步完成:(1)利用查找算法找出该关键字的插入结点(B_树的插入结点一定是叶结点)。(2)判断该结点是否还有空位置,即判断该结点是否满足nm-1,若该结点满足nm-1,说明该结点还有空位置,直接把关键字x.key插入到该结点的合适位置上;若该结点有n=m-1,说明该结点已没有空位置,要插入就要分裂该结点。,B_树的插入算法,该结点分裂方法:先把待插入数据的关键字插入该结点的适当位置;以结点的中间关键字为界分为两个结点;把中间数据元素的关键字向上插入到双亲结点上;若双亲结点未满,则插
22、入合适位置上;若双亲结点已满,则按同样的方法继续向上分裂。在3阶B_树上进行插入操作如下图示:,插入90,n=1;m=3;,未满,nm-1;,在3阶B_树上进行插入操作,n=2;m=3;n=m-1;,插入195,已满,B_树的删除算法,删除分两步完成:(1)利用查找算法找出该关键字所在的结点。(2)在结点上删除关键字x.key分两种情况:一种是在叶结点上删除关键字,共有以下三种情况:,B_树的删除算法,删除分两步完成:(1)利用查找算法找出该关键字所在的结点。(2)在结点上删除关键字x.key分两种情况:一种是在叶结点上删除关键字,共有以下三种情况:,B_树的删除算法,删除分两步完成:(1)利
23、用查找算法找出该关键字所在的结点。(2)在结点上删除关键字x.key分两种情况:一种是在叶结点上删除关键字,共有以下三种情况:,B_树的删除算法,删除分两步完成:(1)利用查找算法找出该关键字所在的结点。(2)在结点上删除关键字x.key分两种情况:一种是在叶结点上删除关键字,共有以下三种情况:(a)假如要删除关键字结点的关键字个数n大于m/2-1,说明删去该关键字后该结点仍满足B_树的定义,则可直接删去该关键字。其过程如下图(b)所示,n=2;m=3;n=m/2-1;,删去该关键字后该结点仍满足B_树的定义,删除110,(b)假如要删除关键字结点的关键字个数n等于m/2-1,说明删去该关键字
24、后该结点将不满足B_树的定义,此时若该结点的左(或右)兄弟结点中关键字个数n大于m/2-1,则把该结点的左(或右)兄弟结点中最大(或最小)的关键字上移到双亲结点中,同时把双亲结点中大于(或小于)上移关键字的关键字下移到要删除关键字的结点中,这样删去关键字后该结点以及它的左(或右)兄弟结点都仍旧满足B_树的定义。其过程如图(c)所示,删除80,n=1;m=3;n=m/2-1;,删去该关键字后该结点不满足B_树的定义,(c)假如要删除关键字结点的关键字个数n等于m/2-1,并且该结点的左和右兄弟结点(如果存在的话)中关键字个数n均等于m/2-1,这时需把要删除关键字的结点与其左(或右)兄弟结点以及
25、双亲结点中分割二者的关键字合并成一个结点。其过程如图(d)所示,删除关键字的结点,选一个兄弟结点,找分割两者的双亲结点的关键字,删除116,n=1;m=3;n=m/2-1;,另一种是在非叶结点上删除关键字。在非叶结点上删除关键字时,假设要删除关键字Ki(1in),以该结点Pi所指子树中寻找的最小关键字Kmin;用Kmin代替被删关键字Ki所在的位置;然后再以指针Pi所指结点为根结点查找并删除Kmin。其过程如图(e)所示,Pi所指子树中的最小关键字Kmin一定是在叶结点上,在非叶结点上删除问题就转化成了叶结点上的删除问题,189,最后利用删除叶结点数据的方法删除189,练习题,对3阶B_树,要
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据结构教学课件 数据结构 教学 课件 11
链接地址:https://www.31ppt.com/p-5898669.html