数据结构-查找技术.ppt
第 7 章 查找技术,本章的主要内容是:,查找的基本概念线性表的查找技术树表的查找技术散列表的查找技术,查找的基本概念,关键码:可以标识一个记录的某个数据项。键值:关键码的值。主关键码:可以唯一地标识一个记录的关键码。次关键码:不能唯一地标识一个记录的关键码。,7.1 概述,查找的基本概念,查找:在具有相同类型的记录构成的集合中找出满足给定条件的记录。,7.1 概述,查找的结果:若在查找集合中找到了与给定值相匹配的记录,则称查找成功;否则,称查找失败。,静态查找:不涉及插入和删除操作的查找。动态查找:涉及插入和删除操作的查找。,7.1 概述,查找的基本概念,静态查找适用于:查找集合一经生成,便只对其进行查找,而不进行插入和删除操作,或经过一段时间的查找之后,集中地进行插入和删除等修改操作;动态查找适用于:查找与插入和删除操作在同一个阶段进行,例如当查找成功时,要删除查找到的记录,当查找不成功时,要插入被查找的记录。,7.1 概述,查找的基本概念,查找结构:面向查找操作的数据结构,即查找基于的数据结构。,集合中元素之间不存在明显的组织规律,不便查找。,本章讨论的查找结构:线性表:适用于静态查找,主要采用顺序查找技术、折半查找技术。树表:适用于动态查找,主要采用二叉排序树的查找技术。散列表:静态查找和动态查找均适用,主要采用散列技术。,7.1 概述,查找结构:面向查找操作的数据结构,即查找基于的数据结构。,查找的基本概念,查找算法的性能,查找算法时间性能通过关键码的比较次数来度量。,算法;问题规模;待查关键码在查找集合中的位置;查找频率。,7.1 概述,查找频率与算法无关,取决于具体应用。通常假设pi是已知的。,查找算法的性能,查找算法时间性能通过关键码的比较次数来度量。,查找算法的时间复杂度是问题规模n和待查关键码在查找集合中的位置k的函数,记为T(n,k)。,7.1 概述,平均查找长度:将查找算法进行的关键码的比较次数的数学期望值定义为平均查找长度。计算公式为:,其中:n:问题规模,查找集合中的记录个数;pi:查找第i个记录的概率;ci:查找第i个记录所需的关键码的比较次数。,结论:ci取决于算法;pi与算法无关,取决于具体应用。如果pi是已知的,则平均查找长度只是问题规模的函数。,7.1 概述,查找算法的性能,顺序查找(线性查找),基本思想:从线性表的一端向另一端逐个将关键码与给定值进行比较,若相等,则查找成功,给出该记录在表中的位置;若整个表检测完仍未找到与给定值相等的关键码,则查找失败,给出失败信息。,10 15 24 6 12 35 40 98 55,0 1 2 3 4 5 6 7 8 9,7.2 线性表的查找技术,例:查找k35,顺序查找(线性查找),7.2 线性表的查找技术,int SeqSearch1(int r,int n,int k)/数组r1 rn存放查找集合 i=n;while(i0,基本思想:设置“哨兵”。哨兵就是待查值,将它放在查找方向的尽头处,免去了在查找过程中每一次比较后都要判断查找位置是否越界,从而提高查找速度。,7.2 线性表的查找技术,改进的顺序查找,10 15 24 6 12 35 40 98 55,0 1 2 3 4 5 6 7 8 9,例:查找k35,哨兵,35,基本思想:设置“哨兵”。哨兵就是待查值,将它放在查找方向的尽头处,免去了在查找过程中每一次比较后都要判断查找位置是否越界,从而提高查找速度。,7.2 线性表的查找技术,改进的顺序查找,10 15 24 6 12 35 40 98 55,0 1 2 3 4 5 6 7 8 9,例:查找k25,25,int SeqSearch2(int r,int n,int k)/数组r1 rn存放查找集合 r0=k;i=n;while(ri!=k)i-;return i;,7.2 线性表的查找技术,改进的顺序查找,平均查找长度较大,特别是当待查找集合中元素较多时,查找效率较低。,7.2 线性表的查找技术,顺序查找的缺点:,算法简单而且使用面广。对表中记录的存储没有任何要求,顺序存储和链接存储均可;对表中记录的有序性也没有要求,无论记录是否按关键码有序均可。,顺序查找的优点:,折半查找,使用条件:线性表中的记录必须按关键码有序;必须采用顺序存储。,基本思想:在有序表中,取中间记录作为比较对象,若给定值与中间记录的关键码相等,则查找成功;若给定值小于中间记录的关键码,则在中间记录的左半区继续查找;若给定值大于中间记录的关键码,则在中间记录的右半区继续查找。不断重复上述过程,直到查找成功,或所查找的区域无记录,查找失败。,7.2 线性表的查找技术,折半查找的基本思想,7.2 线性表的查找技术,例:查找值为14的记录的过程:,0 1 2 3 4 5 6 7 8 9 10 11 12 13,7 14 18 21 23 29 31 35 38 42 46 49 52,3114,1814,714,14=14,7.2 线性表的查找技术,例:查找值为22的记录的过程:,0 1 2 3 4 5 6 7 8 9 10 11 12 13,7 14 18 21 23 29 31 35 38 42 46 49 52,3122,1822,2322,2122,7.2 线性表的查找技术,lowhigh,int BinSearch1(int r,int n,int k)/数组r1 rn存放查找集合 low=1;high=n;while(lowrmid)low=mid+1;else return mid;return 0;,7.2 线性表的查找技术,折半查找非递归算法,int BinSearch2(int r,int low,int high,int k)/数组r1 rn存放查找集合 if(lowhigh)return 0;else mid=(low+high)/2;if(krmid)return BinSearch2(r,mid+1,high,k);else return mid;,7.2 线性表的查找技术,折半查找递归算法,折半查找判定树,判定树:折半查找的过程可以用二叉树来描述,树中的每个结点对应有序表中的一个记录,结点的值为该记录在表中的位置。通常称这个描述折半查找过程的二叉树为折半查找判定树,简称判定树。,7.2 线性表的查找技术,当n=0时,折半查找判定树为空;当n0时,折半查找判定树的根结点是有序表中序号为mid=(n+1)/2的记录,根结点的左子树是与有序表r1 rmid-1相对应的折半查找判定树,根结点的右子树是与rmid+1 rn相对应的折半查找判定树。,7.2 线性表的查找技术,判定树的构造方法,7.2 线性表的查找技术,判定树的构造方法,折半查找有序表(4,6,10,12,20,30,50,70,88,100)。若查找表中元素58,则它将依次与表中 比较大小,查找结果是失败。A20,70,30,50 B30,88,70,50 C20,50 D30,88,50,假定对有序表:(3,4,5,7,24,30,42,54,63,72,87,95)进行折半查找,试回答下列问题:画出描述折半查找过程的判定树;若查找元素54,需依次与哪些元素比较?若查找元素90,需依次与哪些元素比较?假定每个元素的查找概率相等,求查找成功时的平均查找长度。,具有n个结点的折半查找判定树的深度为,查找成功:在表中查找任一记录的过程,即是折半查找判定树中从根结点到该记录结点的路径,和给定值的比较次数等于该记录结点在树中的层数。,查找不成功:查找失败的过程就是走了一条从根结点到外部结点的路径,和给定值进行的关键码的比较次数等于该路径上内部结点的个数。,7.2 线性表的查找技术,折半查找性能分析,二叉排序树,二叉排序树(也称二叉查找树):或者是一棵空的二叉树,或者是具有下列性质的二叉树:若它的左子树不空,则左子树上所有结点的值均小于根结点的值;若它的右子树不空,则右子树上所有结点的值均大于根结点的值;它的左右子树也都是二叉排序树。,7.3 树表的查找技术,二叉排序树的定义采用的是递归方法。,二叉排序树 非二叉排序树,二叉排序树,7.3 树表的查找技术,中序遍历二叉排序树可以得到一个按关键码有序的序列,二叉排序树的存储结构,以二叉链表形式存储,类声明如下:,class BiSortTree public:BiSortTree(int a,int n);BiSortTree();void InsertBST(BiNode*root,BiNode*s);void DeleteBST(BiNode*p,BiNode*f);BiNode*SearchBST(BiNode*root,int k);private:BiNode*root;,7.3 树表的查找技术,二叉排序树的插入,分析:若二叉排序树为空树,则新插入的结点为新的根结点;否则,新插入的结点必为一个新的叶子结点,其插入位置由查找过程得到。,7.3 树表的查找技术,void InsertBST(BiNode*root,BiNode*s);,例:插入值为98的结点,7.3 树表的查找技术,63,55,90,58,70,55,63,root,90,58,70,98,s,root,void BiSortTree:InsertBST(BiNode*root,BiNode*s)if(root=NULL)root=s;else if(s-datadata)InsertBST(root-lchild,s);else InsertBST(root-rchild,s);,7.3 树表的查找技术,二叉排序树的插入算法,二叉排序树的构造,从空的二叉排序树开始,依次插入一个个结点。,例:关键码集合为63,90,70,55,58,二叉排序树的构造过程为:,7.3 树表的查找技术,63,BiSortTree:BiSortTree(int r,int n)for(i=0;i;s-data=ri;s-lchild=s-rchild=NULL;InsertBST(root,s);,7.3 树表的查找技术,二叉排序树的构造算法,一个无序序列可以通过构造一棵二叉排序树而变成一个有序序列;每次插入的新结点都是二叉排序树上新的叶子结点;找到插入位置后,不必移动其它结点,仅需修改某个结点的指针;在左子树/右子树的查找过程与在整棵树上查找过程相同;新插入的结点没有破坏原有结点之间的关系。,小 结:,7.3 树表的查找技术,在一棵空的二叉查找树中依次插入关键字序列为12,7,17,11,16,2,13,9,21,4,请画出所得到的二叉查找树。,二叉排序树的删除,在二叉排序树上删除某个结点之后,仍然保持二叉排序树的特性。,分三种情况讨论:被删除的结点是叶子;被删除的结点只有左子树或者只有右子树;被删除的结点既有左子树,也有右子树。,7.3 树表的查找技术,情况1被删除的结点是叶子结点,7.3 树表的查找技术,操作:将双亲结点中相应指针域的值改为空。,情况2被删除的结点只有左子树或者只有右子树,操作:将双亲结点的相应指针域的值指向被删除结点的左子树(或右子树)。,7.3 树表的查找技术,50,30,20,80,90,85,88,40,35,32,50,30,20,90,85,88,40,35,32,情况3被删除的结点既有左子树也有右子树,操作:以其前驱(左子树中的最大值)替代之,然后再删除该前驱结点。,7.3 树表的查找技术,50,30,20,80,90,85,88,40,35,32,40,30,20,80,90,85,88,35,32,1.若结点p是叶子,则直接删除结点p;2.若结点p只有左子树,则只需重接p的左子树;若结点p只有右子树,则只需重接p的右子树;3.若结点p的左右子树均不空,则 3.1 查找结点p的右子树上的最左下结点s及其双亲结点par;3.2 将结点s数据域替换到被删结点p的数据域;3.3 若结点p的右孩子无左子树,则将s的右子树接到par的右子树上;否则,将s的右子树接到结点par的左子树上;3.4 删除结点s;,7.3 树表的查找技术,二叉排序树的删除算法伪代码,二叉排序树的查找,在二叉排序树中查找给定值k的过程是:,若root是空树,则查找失败;若kroot-data,则查找成功;否则 若kroot-data,则在root的左子树上查找;否则 在root的右子树上查找。上述过程一直持续到k被找到或者待查找的子树为空,如果待查找的子树为空,则查找失败。二叉排序树的查找效率在于只需查找二个子树之一。,7.3 树表的查找技术,例:在二叉排序树中查找关键字值为35,95的过程:,7.3 树表的查找技术,50,30,20,80,90,85,88,40,35,32,二叉排序树的查找,50,30,20,80,90,85,88,40,35,32,BiNode*BiSortTree:SearchBST(BiNode*root,int k)if(root=NULL)return NULL;else if(root-data=k)return root;else if(kdata)return SearchBST(root-lchild,k);else return SearchBST(root-rchild,k);,7.3 树表的查找技术,二叉排序树的查找,二叉排序树的查找性能分析,由序列3,1,2,5,4得到二叉排序树:,由序列1,2,3,4,5得到二叉排序树:,ASL=(1+2+3+4+5)/5=3,ASL=(1+2+3+2+3)/5=2.2,二叉排序树的查找性能取决于二叉排序树的形状,在O(log2n)和O(n)之间。,7.3 树表的查找技术,