数据结构C语言版第7章树形结构.ppt
第7章 树形结构,7.1 树的基本概念,7.2 二叉树概念和性质,7.3 二叉树存储结构,7.4 二叉树的遍历,7.5 二叉树的基本运算及其实现,7.6 二叉树的构造,7.8 哈夫曼树,本章小结,7.7 线索二叉树,7.1 树的基本概念,7.1.1 树的定义,7.1.3 树的基本术语,7.1.2 树的表示,7.1.4 树的性质,7.1.5 树的基本运算,7.1.6 树的存储结构,7.1.1 树的定义 形式化定义:树:TK,R。K是包含n个结点的有穷集合(n0),关系R满足以下条件:(1)有且仅有一个结点k0K,它对于关系R来说没有前驱结点,结点k0称作树的根。(2)除结点k0外,K中的每个结点对于关系R来说都有且仅有一个前驱结点。(3)K中每个结点对于关系R来说可以有多个后继结点。,递归定义:树是由n(n0)个结点组成的有限集合(记为T)。其中,如果n=0,它是一棵空树,这是树的特例;如果n0,这n个结点中存在(有仅存在)一个结点作为树的根结点,简称为根(root),其余结点可分为m(m0)个互不相交的有限集T1,T2,Tm,其中每一棵子集本身又是一棵符合本定义的树,称为根root的子树。,7.1.2 树的表示,(1)树形表示法。这是树的最基本的表示,使用一棵倒置的树表示树结构,非常直观和形象。下图就是采用这种表示法。,(2)文氏图表示法。使用集合以及集合的包含关系描述树结构。下图就是树的文氏图表示法。,(3)凹入表示法。使用线段的伸缩描述树结构。下图是树的凹入表示法。,(4)括号表示法。将树的根结点写在括号的左边,除根结点之外的其余结点写在括号中并用逗号间隔来描述树结构。下图是树的括号表示法。,7.1.3 树的基本术语 1.结点的度与树的度:树中某个结点的子树的个数称为该结点的度。树中各结点的度的最大值称为树的度,通常将度为m的树称为m次树。2.分支结点与叶结点:度不为零的结点称为非终端结点,又叫分支结点。度为零的结点称为终端结点或叶结点。在分支结点中,每个结点的分支数就是该结点的度。如对于度为1的结点,其分支数为1,被称为单分支结点;对于度为2的结点,其分支数为2,被称为双分支结点,其余类推。,3.路径与路径长度:对于任意两个结点ki和kj,若树中存在一个结点序列ki,ki1,ki2,kin,kj,使得序列中除ki外的任一结点都是其在序列中的前一个结点的后继,则称该结点序列为由ki到kj的一条路径,用路径所通过的结点序列(ki,ki1,ki2,kj)表示这条路径。路径的长度等于路径所通过的结点数目减1(即路径上分支数目)。可见,路径就是从ki出发“自上而下”到达kj所通过的树中结点序列。显然,从树的根结点到树中其余结点均存在一条路径。,4.孩子结点、双亲结点和兄弟结点:在一棵树中,每个结点的后继,被称作该结点的孩子结点(或子女结点)。相应地,该结点被称作孩子结点的双亲结点(或父母结点)。具有同一双亲的孩子结点互为兄弟结点。进一步推广这些关系,可以把每个结点的所有子树中的结点称为该结点的子孙结点,从树根结点到达该结点的路径上经过的所有结点被称作该结点的祖先结点。,5.结点的层次和树的高度:树中的每个结点都处在一定的层次上。结点的层次从树根开始定义,根结点为第1层,它的孩子结点为第2层,以此类推,一个结点所在的层次为其双亲结点所在的层次加1。树中结点的最大层次称为树的高度(或树的深度)。7.有序树和无序树:若树中各结点的子树是按照一定的次序从左向右安排的,且相对次序是不能随意变换的,则称为有序树,否则称为无序树。,7.森林:n(n0)个互不相交的树的集合称为森林。森林的概念与树的概念十分相近,因为只要把树的根结点删去就成了森林。反之,只要给n棵独立的树加上一个结点,并把这n棵树作为该结点的子树,则森林就变成了树。,7.1.4 树的性质性质1 树中的结点数等于所有结点的度数加1。证明:根据树的定义,在一棵树中,除树根结点外,每个结点有且仅有一个前驱结点。也就是说,每个结点与指向它的一个分支一一对应,所以除树根之外的结点数等于所有结点的分支数(度数),从而可得树中的结点数等于所有结点的度数加1。,性质2 度为m的树中第i层上至多有mi-1个结点,这里应有i1。证明(采用数学归纳法)对于第一层,因为树中的第一层上只有一个结点,即整个树的根结点,而由i=1代入mi-1,得mi-1=m1-1=1,也同样得到只有一个结点,显然结论成立。假设对于第(i-1)层(i1)命题成立,即度为m的树中第(i-1)层上至多有mi-2个结点,则根据树的度的定义,度为m的树中每个结点至多有m个孩子结点,所以第i层上的结点数至多为第(i-1)层上结点数的m倍,即至多为mi-2m=mi-1个,这与命题相同,故命题成立。,性质3 高度为h的m次树至多有 个结点。证明:由树的性质2可知,第i层上最多结点数为mi-1(i=1,2,h),显然当高度为h的m次树(即度为m的树)上每一层都达到最多结点数时,整个m次树具有最多结点数,因此有:整个树的最多结点数=每一层最多结点数之和=m0+m1+m2+mh-1=。,性质4 具有n个结点的m次树的最小高度为logm(n(m-1)+1)。证明:设具有n个结点的m次树的高度为h,若在该树中前h-1层都是满的,即每一层的结点数都等于mi-1个(1ih-1),第h层(即最后一层)的结点数可能满,也可能不满,则该树具有最小的高度。其高度h可计算如下:,根据树的性质3可得:n乘(m-1)后得:mh-1n(m-1)+1mh以m为底取对数后得:h-1logm(n(m-1)+1)h即logm(n(m-1)+1)hlogm(n(m-1)+1)+1因h只能取整数,所以 h=logm(n(m-1)+1)结论得证。,例7.1 含n个结点的三次树的最小高度是多少?解:设含n个结点的(为完全三次树时高度最小)的三次树的最小高度为h,则有:1+3+9+3h-2n1+3+9+3h-1(3h-1-1)/2 n(3h-1)/2 3h-12n+13h 即:h=log3(2n+1),7.1.5 树的基本运算,树的运算主要分为三大类:第一类,寻找满足某种特定关系的结点,如寻找当前结点的双亲结点等;第二类,插入或删除某个结点,如在树的当前结点上插入一个新结点或删除当前结点的第i个孩子结点等;第三类,遍历树中每个结点,这里着重介绍。,树的遍历运算是指按某种方式访问树中的每一个结点且每一个结点只被访问一次。树的遍历运算的算法主要有先根遍历和后根遍历两种。注意,下面的先根遍历和后根遍历算法都是递归的。1.先根遍历 先根遍历过程为:(1)访问根结点;(2)按照从左到右的次序先根遍历根结点的每一棵子树。,2.后根遍历 后根遍历过程为:(1)按照从左到右的次序后根遍历根结点的每一棵子树;(2)访问根结点。,7.1.6 树的存储结构,1.双亲存储结构 这种存储结构是一种顺序存储结构,用一组连续空间存储树的所有结点,同时在每个结点中附设一个伪指针指示其双亲结点的位置。,树的双亲存储结构示意图,2.孩子链存储结构 孩子链存储结构可按树的度(即树中所有结点度的最大值)设计结点的孩子结点指针域个数。下图(a)的树对应的孩子链存储结构如图(b)所示。,树的孩子链存储结构示意图,3.孩子兄弟链存储结构 孩子兄弟链存储结构是为每个结点设计三个域:一个数据元素域,一个该结点的第一个孩子结点指针域,一个该结点的下一个兄弟结点指针域。下图(a)的树对应的孩子兄弟链存储结构如图(b)所示。,树的孩子兄弟链存储结构示意图,7.2 二叉树概念和性质,7.2.1 二叉树概念,7.2.2 二叉树性质,7.2.3 二叉树与树、森林之间的转换,7.2.1 二叉树概念 二叉树也称为二次树或二分树,它是有限的结点集合,这个集合或者是空,或者由一个根结点和两棵互不相交的称为左子树和右子树的二叉树组成。二叉树的定义是一种递归定义。,二叉树有五种基本形态,如下图所示,任何复杂的二叉树都是这五种基本形态的复合。,从定义看到,二叉树是一种特殊的树,其表示法也与树的表示法一样,有树形表示法、文氏图表示法、凹入表示法和括号表示法等。,在一棵二叉树中,如果所有分支结点都有左孩子结点和右孩子结点,并且叶结点都集中在二叉树的最下一层,这样的二叉树称为满二叉树。下图所示就是一棵满二叉树。可以对满二叉树的结点进行连续编号,约定编号从树根为1开始,按照层数从小到大、同一层从左到右的次序进行。图中每个结点外边的数字为对该结点的编号。,若二叉树中最多只有最下面两层的结点的度数可以小于2,并且最下面一层的叶结点 都依次排列在该层最左边的位置上,则这样的二叉树称为完全二叉树。如下图所示为一棵完全二叉树。同样可以对完全二叉树中每个结点进行连续编号,编号的方法同满二叉树相同。图中每个结点外边的数字为对该结点的编号。,7.2.2 二叉树性质 性质1 非空二叉树上叶结点数等于双分支结点数加1。证明:设二叉树上叶结点数为n0,单分支结点数为n1,双分支结点数为n2,则总结点数=n0+n1+n2。在一棵二叉树中,所有结点的分支数(即度数)应等于单分支结点数加上双分支结点数的2倍,即总的分支数=n1+2n2。由于二叉树中除根结点以外,每个结点都有惟一的一个分支指向它,因此二叉树中有:总的分支数=总结点数-1。由上述三个等式可得:n1+2n2=n0+n1+n2-1即:n0=n2+1,性质2 非空二叉树上第i层上至多有2i-1个结点,这里应有i1。由树的性质2可推出。性质3 高度为h的二叉树至多有2h-1个结点(h1)。由树的性质3可推出。,性质4 对完全二叉树中编号为i的结点(1in,n1,n为结点数)有:(1)若in/2,即2in,则编号为i的结点为分支结点,否则为叶子结点。(2)若n为奇数,则每个分支结点都既有左孩子结点,也有右孩子结点;若n为偶数,则编号最大的分支结点(编号为)只有左孩子结点,没有右孩子结点,其余分支结点都有左、右孩子结点。,(3)若编号为i的结点有左孩子结点,则左孩子结点的编号为2i;若编号为i的结点有右孩子结点,则右孩子结点的编号为(2i+1)。(4)除树根结点外,若一个结点的编号为i,则它的双亲结点的编号为i/2,也就是说,当i为偶数时,其双亲结点的编号为i/2,它是双亲结点的左孩子结点,当i为奇数时,其双亲结点的编号为(i-1)/2,它是双亲结点的右孩子结点。,性质5 具有n个(n0)结点的完全二叉树的高度为log2(n+1)或log2n+1。由完全二叉树的定义和树的性质3可推出。,7.2.3 二叉树与树、森林之间的转换,1森林、树转换为二叉树(1)在所有相邻兄弟结点(森林中每棵树的根结点可看成是兄弟结点)之间加一水平连线。(2)对每个非叶结点k,除了其最左边的孩子结点外,删去k与其他孩子结点的连线。(3)所有水平线段以左边结点为轴心顺时针旋转45度。通过以上步骤,原来的森林就转换为一棵二叉树。一般的树是森林中的特殊情况,由一般的树转换的二叉树的根结点的右孩子结点始终为空,原因是一般的树的根结点不存在兄弟结点和相邻的树。,将森林转换为二叉树的过程,2.二叉树还原为森林、树,(1)对于一棵二叉树中任一结点k0,沿着k1右孩子结点的右子树方向搜索所有右孩子结点,即搜索结点序列k2,k3,km,其中ki+1为ki的右孩子结点(1im),km没有右孩子结点。(2)删去k1,k2,km之间连线。(3)若k1有双亲结点k,则连接k与ki(2im)。(4)将图形规整化,使各结点按层次排列。,将一棵二叉树还原为树的过程,7.3 二叉树存储结构,7.3.1 二叉树的顺序存储结构,7.3.2 二叉树的链式存储结构,7.3.1 二叉树的顺序存储结构 二叉树的顺序存储结构中结点的存放次序是:对该树中每个结点进行编号,其编号从小到大的顺序就是结点存放在连续存储单元的先后次序。若把二叉树存储到一维数组中,则该编号就是下标值加1(注意,C/C+语言中数组的起始下标为0)。树中各结点的编号与等高度的完全二叉树中对应位置上结点的编号相同。利用二叉树的性质4。,顺序存储结构,7.3.2 二叉树的链式存储结构 在二叉树的链接存储中,结点的结构如下:typedef struct node ElemType data;struct node*lchild,*rchild;BTNode;其中,data表示值域,用于存储对应的数据元素,lchild和rchild分别表示左指针域和右指针域,用于分别存储左孩子结点和右孩子结点(即左、右子树的根结点)的存储位置。,二叉树及其链式存储结构,7.4 二叉树的遍历,7.4.1 二叉树遍历的概念,7.4.2 二叉树遍历递归算法,7.4.1 二叉树遍历的概念 二叉树的遍历是指按照一定次序访问树中所有结点,并且每个结点仅被访问一次的过程。它是最基本的运算,是二叉树中所有其他运算的基础。,1.先序遍历先序遍历二叉树的过程是:(1)访问根结点;(2)先序遍历左子树;(3)先序遍历右子树。2.中序遍历中序遍历二叉树的过程是:(1)中序遍历左子树;(2)访问根结点;(3)中序遍历右子树。,3.后序遍历后序遍历二叉树的过程是:(1)后序遍历左子树;(2)后序遍历右子树;(3)访问根结点。,7.4.2 二叉树遍历递归算法 由二叉树的三种遍历过程直接得到如下三种递归算法如下:void PreOrder(BTNode*b)/*先序遍历的递归算法*/if(b!=NULL)printf(%c,b-data);/*访问根结点*/PreOrder(b-lchild);PreOrder(b-rchild);,void InOrder(BTNode*b)/*中序遍历的递归算法*/if(b!=NULL)InOrder(b-lchild);printf(%c,b-data);/*访问根结点*/InOrder(b-rchild);,void PostOrder(BTNode*b)/*后序遍历递归算法*/if(b!=NULL)PostOrder(b-lchild);PostOrder(b-rchild);printf(%c,b-data);/*访问根结点*/,例7.2 假设二叉树采用二叉链存储结构存储,试设计一个算法,输出一棵给定二叉树的所有叶子结点。解:输出一棵二叉树的所有叶子结点的递归模型f()如下:f(b):不做任何事件 若b=NULL f(b):输出*b结点的data域 若*b为叶子结点 f(b):f(b-lchild);f(b-rchild)其他情况,void DispLeaf(BTNode*b)if(b!=NULL)if(b-lchild=NULL,7.5 二叉树的基本运算及其实现,7.5.1 二叉树的基本运算概述,7.5.2 二叉树的基本运算算法实现,7.5.1 二叉树的基本运算概述 归纳起来,二叉树有以下基本运算:(1)创建二叉树CreateBTNode(*b,*str):根据二叉树括号表示法的字符串*str生成对应的链式存储结构。(2)查找结点FindNode(*b,x):在二叉树b中寻找data域值为x的结点,并返回指向该结点的指针。(3)找孩子结点LchildNode(p)和RchildNode(p):分别求二叉树中结点*p的左孩子结点和右孩子结点。,(4)求高度BTNodeDepth(*b):求二叉树b的高度。若二叉树为空,则其高度为0;否则,其高度等于左子树与右子树中的最大高度加l。(5)输出二叉树DispBTNode(*b):以括号表示法输出一棵二叉树。,7.5.2 二叉树的基本运算算法实现(1)创建二叉树CreateBTNode(*b,*str)用ch扫描采用括号表示法表示二叉树的字符串。分以下几种情况:若ch=(:则将前面刚创建的结点作为双亲结点进栈,并置k=1,表示其后创建的结点将作为这个结点的左孩子结点;若ch=):表示栈中结点的左右孩子结点处理完毕,退栈;若ch=,:表示其后创建的结点为右孩子结点;,其他情况,表示要创建一个结点,并根据k值建立它与栈中结点之间的联系,当k=1时,表示这个结点作为栈中结点的左孩子结点,当k=2时,表示这个结点作为栈中结点的右孩子结点。如此循环直到str处理完毕。算法中使用一个栈St保存双亲结点,top为其栈指针,k指定其后处理的结点是双亲结点(保存在栈中)的左孩子结点(k=1)还是右孩子结点(k=2)。,void CreateBTNode(BTNode*/*为孩子结点右结点*/,default:p=(BTNode*)malloc(sizeof(BTNode);p-data=ch;p-lchild=p-rchild=NULL;if(b=NULL)/*p为二叉树的根结点*/b=p;else/*已建立二叉树根结点*/switch(k)case 1:Sttop-lchild=p;break;case 2:Sttop-rchild=p;break;j+;ch=strj;,例如,对于括号表示串A(B(D(,G),C(E,F),建立二叉树链式存储结构的过程如下表所示。,生成的二叉树,(2)查找结点FindNode(*b,x)采用先序遍历递归算法查找值为x的结点。找到后返回其指针,否则返回NULL。算法如下:BTNode*FindNode(BTNode*b,ElemType x)BTNode*p;if(b=NULL)return NULL;else if(b-data=x)return b;else p=FindNode(b-lchild,x);if(p!=NULL)return p;else return FindNode(b-rchild,x);,(3)找孩子结点LchildNode(p)和RchildNode(p)直接返回*p结点的左孩子结点或右孩子结点的指针。算法如下:BTNode*LchildNode(BTNode*p)return p-lchild;BTNode*RchildNode(BTNode*p)return p-rchild;,(4)求高度BTNodeDepth(*b)求二叉树的高度的递归模型f()如下:f(NULL)=0 f(b)=MAXf(b-lchild),f(b-rchild)+1 其他情况对应的算法如下:,int BTNodeDepth(BTNode*b)int lchilddep,rchilddep;if(b=NULL)return(0);/*空树的高度为0*/else lchilddep=BTNodeDepth(b-lchild);/*求左子树的高度为lchilddep*/rchilddep=BTNodeDepth(b-rchild);/*求右子树的高度为rchilddep*/return(lchilddeprchilddep)?(lchilddep+1):(rchilddep+1);,(5)输出二叉树DispBTNode(*b)其过程是:对于非空二叉树b,先输出其元素值,当存在左孩子结点或右孩子结点时,输出一个“(”符号,然后递归处理左子树,输出一个“,”符号,递归处理右子树,最后输出一个“)”符号。对应的递归算法如下:,void DispBTNode(BTNode*b)if(b!=NULL)printf(%c,b-data);if(b-lchild!=NULL|b-rchild!=NULL)printf();DispBTNode(b-lchild);/*递归处理左子树*/if(b-rchild!=NULL)printf(,);DispBTNode(b-rchild);/*递归处理右子树*/printf();,例7.3 假设二叉树采用二叉链存储结构,设计一个算法判断两棵二叉树是否相似,所谓二叉树t1和t2是相似的指的是t1和t2都是空的二叉树;或者t1和t2的根结点是相似的,以及t1的左子树和t2的左子树是相似的且t1的右子树与t2的右子树是相似的。解:判断两棵二叉树是否相似的递归模型f()如下:f(t1,t2)=true 若t1=t2=NULLf(t1,t2)=false 若t1、t2之一为NULL,另一不为NULLf(t1,t2)=f(t1-lchild,t2-lchild)&其他情况 f(t1-rchild,t2-rchild)对应的算法如下:,int Like(BTNode*b1,BTNode*b2)/*t1和t2两棵二叉树相似时返回1,否则返回0*/int like1,like2;if(b1=NULL/*返回like1和like2的与*/,例7.4 假设二叉树采用二叉链存储结构,设计一个算法Level()求二叉树中指定结点的层数。并利用本节的基本运算编写一个完整的程序,建立教材中图7.8(a)的二叉树的二叉链,对于用户输入的任何结点值计算出在该二叉树中的层次。解:本题采用递归算法,设h返回p所指结点的高度,其初值为0。找到指定的结点时返回其层次;否则返回0。lh作为一个中间变量在计算搜索层次时使用,其初值为1。对应的算法如下:,void Level(BTNode*b,BTNode*p,int,例7.5 假设二叉树采用二叉链存储结构,设计一个算法输出从每个叶子结点到根结点的路径。解:这里用层次遍历方法,设计的队列为非循环顺序队列(类似于第3章小节中求解迷宫问题时使用的队列)将所有已扫描过的结点指针进队,并在队列中保存双亲结点的位置。当找到一个叶子结点时,在队列中通过双亲结点的位置输出该叶子结点到根结点的路径。对应的算法如下:,void AllPath(BTNode*b)struct snode BTNode*node;/*存放当前结点指针*/int parent;/*存放双亲结点在队列中的位置*/qMaxSize;/*定义顺序队列*/int front,rear,p;/*定义队头和队尾指针*/front=rear=-1;/*置队列为空队列*/rear+;qrear.node=b;/*根结点指针进入队列*/qrear.parent=-1;/*根结点没有双亲结点*/,while(frontlchild=NULL/*end of while*/,7.6 二叉树的构造,同一棵二叉树具有惟一先序序列、中序序列和后序序列,但不同的二叉树可能具有相同的先序序列、中序序列和后序序列。例如,如教材中图7.9所示的5棵二叉树,先序序列都为ABC。如图7.10所示的5棵二叉树,中序序列都为ACB。如图7.11所示的5棵二叉树,后序序列都为CBA。,显然,仅由一个先序序列(或中序序列、后序序列),无法确定这棵二叉树的树形。但是,如果同时知道一棵二叉树的先序序列和中序序列,或者同时知道中序序列和后序序列,就能确定这棵二叉树。定理7.1:任何n(n0)个不同结点的二又树,都可由它的中序序列和先序序列惟一地确定。,采用数学归纳法证明。当n=0时,二叉树为空,结论正确。假设结点数小于n的任何二叉树,都可以由其先序序列和中序序列惟一地确定。已知某棵二叉树具有n(n0)个不同结点,其先序序列是a0a1an-1;中序序列是b0b1bk-1bkbk+1bn-1。因为在先序遍历过程中,访问根结点后,紧跟着遍历左子树,最后再遍历右子树。所以,a0必定是二叉树的根结点,而且a0必然在中序序列中出现。也就是说,在中序序列中必有某个bk(0kn-1)就是根结点a0。,由于bk是根结点,而在中序遍历过程中,先遍历左子树,再访问根结点,最后再遍历右子树。所以在中序序列中,b0b1bk-1必是根结点bk(也就是a0)左子树的中序序列,即bk的左子树有k个结点(注意,k=0表示结点bk没有左子树。)而bk+1bn-1必是根结点bk(也就是a0)右子树的中序序列,即bk的右子树有n-k-1个结点(注意,k=n-1表示结点bk没有右子树。)。另外,在先序序列中,紧跟在根结点a0之后的k个结点a1ak就是左子树的先序序列,ak+1an-1这n-k-1就是右子树的先序序列。,根据归纳假设,由于子先序序列a1ak和子中序序列b0b1bk-1可以惟一地确定根结点a0的左子树,而子先序序列ak+1an-1和子中序序列bk+1bn-1可以惟一地确定根结点a0的右子树。综上所述,这棵二叉树的根结点己经确定,而且其左、右子树都惟一地确定了,所以整个二叉树也就惟一地确定了。,例如,已知先序序列为ABDGCEF,中序序列为DGBAECF,则构造二叉树的过程如下所示。,根结点:A左先序:BDG 左中序:DGB右先序:CEF 右中序:ECF,根结点:B左先序:DG 左中序:DG右先序:空 右中序:空,根结点:D左先序:空 左中序:空右先序:G 右中序:G,根结点:G左先序:空 左中序:空右先序:空 右中序:空,根结点:C左先序:E 左中序:E右先序:F 右中序:F,根结点:E左先序:空 左中序:空右先序:空 右中序:空,根结点:F左先序:空 左中序:空右先序:空 右中序:空,由上述定理得到以下构造二叉树的算法:BTNode*CreateBT1(char*pre,char*in,int n)BTNode*s;char*p;int k;if(ndata=*pre;for(p=in;plchild=CreateBT1(pre+1,in,k);/*递归构造左子树*/s-rchild=CreateBT1(pre+k+1,p+1,n-k-1);/*构造右子树*/return s;,定理7.2:任何n(n0)个不同结点的二又树,都可由它的中序序列和后序序列惟一地确定。同样采用数学归纳法证明。实际上,对于根结点ak的左右子树,在确定左右子树的子中序序列后,不需要确定左右子树的整个子后序序列,只需确定子中序序列中全部字符在后序序列中最右边的那个字符即可,因为这个字符就是子树的根结点。,例如,已知中序序列为DGBAECF,后序序列为GDBEFCA。对应的构造二叉树的过程如下所示。,根结点:A左中序:DGB 左根:B右中序:ECF 右根:C,根结点:B左中序:DG 左根:D右中序:空 右根:空,根结点:D左中序:空 左根:空右中序:G 右根:G,根结点:G左中序:空 左根:空右中序:空 右根:空,根结点:C左中序:E 左根:E右中序:F 右根:F,根结点:E左中序:空 左根:空右中序:空 右根:空,根结点:F左中序:空 左根:空右中序:空 右根:空,由上述定理得到以下构造二叉树的算法:BTNode*CreateBT2(char*post,char*in,int n,int m)BTNode*s;char*p,*q,*maxp;int maxpost,maxin,k;if(nmaxpost)maxpost=k;maxp=p;maxin=p-in;,s=(BTNode*)malloc(sizeof(BTNode);/*创建二叉树结点*s*/s-data=postmaxpost;s-lchild=CreateBT2(post,in,maxin,m);/*递归构造左子树*/s-rchild=CreateBT2(post,maxp+1,n-maxin-1,m);/*递归构造右子树*/return s;,7.7 线索二叉树7.7.1 线索二叉树的概念 对于具有n个结点的二叉树,采用二叉链存储结构时,每个结点有两个指针域,总共有2n个指针域,又由于只有n-1个结点被有效指针所指向(n个结点中只有树根结点没有被有效指针域所指向),则共有2n-(n-1)=n+1个空链域,我们知道,遍历二叉树的结果是一个结点的线性序列。可以利用这些空链域存放指向结点的前驱和后继结点的指针。这样的指向该线性序列中的“前驱”和“后继”的指针,称作线索。,在结点的存储结构上增加两个标志位来区分这两种情况:左标志ltag:0 表示lchild指向左孩子结点 1 表示lchild指向前驱结点右标志rtag:0 表示rchild指向右孩子结点 1 表示rchild指向后继结点这样,每个结点的存储结构如下:,按上述原则在二叉树的每个结点上加上线索的二叉树称作线索二叉树。对二叉树以某种方式遍历使其变为线索二叉树的过程称作按该方式对二叉树进行线索化。,为使算法设计方便,在线索二叉树中再增加一个头结点。头结点的data域为空;lchild指向无线索时的根结点,ltag为0;rchild指向按某种方式遍历二叉树时的最后一个结点,rtag为1。教材中图7.14为图7.8(a)所示二叉树的线索二叉树。其中,图7.14(a)是中序线索二叉树(中序序列为:DGBAECF),图7.14(b)是先序线索二叉树(先序序列为:ABDGCEF),图7.14(c)是后序线索二叉树(后序序列为:GDBEFCA)。图中实线表示二叉树原来指针所指的结点,虚线表示线索二叉树所添加的线索。,7.7.2 线索化二叉树 建立线索二叉树,或者说,对二叉树线索化,实质上就是遍历一棵二叉树,在遍历的过程中,检查当前结点的左、右指针域是否为空。如果为空,将它们改为指向前驱结点或后继结点的线索。另外,在对一棵二叉树添加线索时,我们创建一个头结点,并建立头结点与二叉树的根结点的线索。对二叉树线索化后,还须建立最后一个结点与头结点之间的线索。下面以中序线索二叉树为例,讨论建立线索二叉树的算法。,为了实现线索化二叉树,将前面二叉树结点的类型定义修改如下:typedef struct node ElemType data;/*结点数据域*/int ltag,rtag;/*增加的线索标记*/struct node*lchild;/*左孩子或线索指针*/struct node*rchild;/*右孩子或线索指针*/TBTNode;/*线索树结点类型定义*/,下面是建立中序线索二叉树的算法。CreaThread(b)算法是将以二叉链存储的二叉树b进行中序线索化,并返回线索化后头结点的指针root。Thread(p)算法用于对于以*p为根结点的二叉树中序线索化。在整个算法中p总是指向当前被线索化的结点,而pre作为全局变量,指向刚刚访问过的结点,*pre是*p的前驱结点,*p是*pre的后继结点。,CreaThread(b)算法思路是:先创建头结点*root,其lchild域为线索,rchild域为链指针。将rchild指针指向*b,如果b二叉树为空,则将其lchild指向自身。否则将*root的lchild指向*b结点,p指向*b结点,pre指向*root结点。再调用Thread(b)对整个二叉树线索化。最后加入指向头结点的线索,并将头结点的rchild指针域线索化为指向最后一个结点(由于线索化直到p等于NULL为止,所以最后一个结点为*pre)。,TBTNode*CreaThread(TBTNode*b)/*中序线索化二叉树*/TBTNode*root;root=(TBTNode*)malloc(sizeof(TBTNode);/*创建头结点*/root-ltag=0;root-rtag=1;root-rchild=b;if(b=NULL)root-lchild=root;/*空二叉树*/else root-lchild=b;pre=root;/*pre是*p的前驱结点,供加线索用*/Thread(b);/*中序遍历线索化二叉树*/pre-rchild=root;/*最后处理,加入指向头结点的线索*/pre-rtag=1;root-rchild=pre;/*头结点右线索化*/return root;,Thread(p)算法思路是:类似于中序遍历的递归算法,在p指针不为NULL时,先对*p结点的左子树线索化;若*p结点没有左孩子结点,则将其lchild指针线索化为指向其前驱结点*pre,否则表示lchild指向其左孩子结点,将其ltag置为1;若*pre结点的rchild指针为NULL,将其rchild指针线索化为指向其后继结点*p,否则rchild表示指向其右孩子结点,将其rtag置为1,再将pre指向*p;最后对*p结点的右子树线索化。,TBTNode*pre;/*全局变量*/void Thread(TBTNode*/*递归调用右子树线索化*/,中序遍历(递归),7.7.3 遍历线索化二叉树 遍历某种次序的线索二叉树,就是从该次序下的开始结点出发,反复找到该结点在该次序下的后继结点,直到终端结点。在中序线索二叉树中,开始结点就是根结点的最左下结点,而求当前结点在中序序列下的后继和前驱结点的方法如教材中表7.2所示,最后一个结点的rchild指针被线索化为指向头结点。利用这些条件,在中序线索化二叉树中实现中序遍历的算法如下:,void ThInOrder(TBTNode*tb)TBTNode*p=tb-lchild;/*p指向根结点*/while(p!=tb)while(p-ltag=0)p=p-lchild;/*找开始结点*/printf(%c,p-data);/*访问开始结点*/while(p-rtag=1,7.8 哈夫曼树,7.8.1 哈夫曼树的定义,7.8.2 构造哈夫曼树,7.8.3 哈夫曼编码,7.8.1 哈夫曼树的定义 设二叉树具有n个带权值的叶子结点,那么从根结点到各个叶子结点的路径长度与相应结点权值的乘积的和,叫做二叉树的带权路径长度。其中,n表示叶子结点的数目,wi和li分别表示叶子结点ki的权值和根到ki之间的路径长度(即从叶子结点到达根结点的分支数)。具有最小带权路径长度的二叉树称为哈夫曼树。,7.8.2 构造哈夫曼树 根据哈夫曼树的定义,一棵二叉树要使其WPL值最小,必须使权值越大的叶子结点越靠近根结点,而权值越小的叶子结点越远离根结点。那么如何构造一棵哈夫曼树呢?其方法如下:(1)由给定的n个权值W1,W2,.,Wn构造n棵只有一个叶子结点的二叉树,从而得到一个二叉树的集合F=T1,T2,.,Tn;,(2)在F中选取根结点的权值最小和次小的两棵二叉树作为左、右子树构造一棵新的二叉树,这棵新的二叉树根结点的权值为其左、右子树根结点权值之和;(3)在集合F中删除作为左、右子树的两棵二叉树,并将新建立的二叉树加入到集合F中;(4)重复(2)、(3)两步,当F中只剩下一棵二叉树时,这棵二叉树便是所要建立的哈夫曼树。,给定权值w=(1,3,5,7)来构造一棵哈夫曼树。,构造一棵哈夫曼树的过程,为了实现构造哈夫曼树的算法,设计哈夫曼树中每个结点类型如下:typedef struct char data;/*结点值*/float weight;/*权重*/int parent;/*双亲结点*/int lchild;/*左孩子结点*/int rchild;/*右孩子结点*/HTNode;,用ht数组存放哈夫曼树,对于具有n个叶子结点的哈夫曼树,总共有2n-1个结点。其算法思路是:n个叶子结点只有data和weight域值,先将所有2n-1个结点的parent、lchild和rchild域置为初值-1。处理每个非叶子结点hti(存放在htnht2n-2中):从ht0 hti-2中找出根结点(即其parent域为-1)最小的两个结点htlnode和htrnode,将它们作为hti的左右子树,htlnode和htrnode的双亲结点置为hti,并且hti.weight=htlnode.weight+htrnode.weight。如此这样直到所有2n-1个非叶子结点处理完毕。构造哈夫曼树的算法如下:,void CreateHT(HTNode ht,int n)int i,j,k,lnode,rnode;float min1,min2;for(i=0;i2*n-1;i+)/*所有结点的相关域置初值-1*/hti.parent=hti.lchild=hti.rchild=-1;for(i=n;i2*n-1;i+)/*构造哈夫曼树*/min1=min2=32767;lnode=rnode=-1;for(k=0;k=i-1;k+)if(htk.parent=-1)/*未构造二叉树的结点中查找*/if(htk.weightmin1)min2=min1;rnode=lnode;min1=htk.weight;lnode=k;else if(htk.weightmin2)min2=htk.weight;rnod