王道数据结构5.2（树的应用）

Posted 2022-11-23 晨沉宸辰

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了王道数据结构5.2（树的应用）相关的知识，希望对你有一定的参考价值。

树的应用

一、二叉排序树
二、平衡二叉树
三、哈夫曼树

一、二叉排序树

(一) 基础

定义：又称为二叉查找树，一棵二叉树或空二叉树，或者具有如下性质的二叉树：
① 左子树上所有结点的关键字均小于根结点的关键字。
② 右子树上所有结点的关键字均大于根结点的关键字。
③ 左右子树又各是一棵二叉排序树。
利用中序遍历，可以得到一个递增的有序序列。

(二) 操作

1. 二叉排序树的查找

（1）思想：
若树非空，目标值与根结点的值比较：
①若相等，则查找成功。
②若小于根结点，则查找左子树，若大于根结点，则查找右子树
查找成功则返回节点指针，查找失败，则返回NULL。
（2）代码：

//二叉排序树结点 
typedef struct BSTNode
    int key;
    struct BSTNode *lchild,*rchild;
BSTNode,*BSTree;
//在二叉排序树中查找值为key的结点（非递归）
BSTNode *BST_Search(BSTNode T,int key)
   while(T!=NULL&&key!=T->key)
        if(key<T->key)
           T=T->lchild;
        else T=T->rchild;
   
   return T;

//在二叉排序树中查找值为key的结点（递归）
BSTNode *BSTSearch(BSTree T,int key)
    if(T==NULL)
        returm NULL;
    if(key==T->key)
        return T;
    else if(key==T->key)
        return BSTSearch(T->lchild,key)；
    else
        return BSTSearch(T->rchild,key);

分析：
① 非递归算法时间复杂度为O(1)
② 最坏时间复杂度为O(h)

2. 二叉排序树的插入

思想：若原二叉排序树为空，则直接插入结点，否则，若关键字k小于根结点值，则插入左子树，若关键字k大于根结点，则插入到右子树。
代码：

//在二叉排序树插入关键字k的新结点（递归实现）
int BST_Insert(BSTree &T,int k)
  if(T==NULL)
     T=(BSTree)malloc(sizeof(BSTNode));
    T->key=k;
    T->lchild=T->rchild=NULL;
    return 1;
  
  else if(k==T->key)
    return 0;
  else if(k<T->key)
    return BST_Insert(T->lchild,k);
  else 
    return BST_Insert(T->rchild,k);

3. 二叉排序树的构造

代码：

//按照str[]中的关键字序列建立二叉排序树
void Creat_BST(BSTree &T,int str[],int n)
  T=NULL;
  int i=0;
  while(i<n)
    BST_Insert(T,str[i]);
    i++;
  

//插入结点
int BST_Insert(BSTree &T,int k)
  if(T==NULL)
     T=(BSTree)malloc(sizeof(BSTNode));
    T->key=k;
    T->lchild=T->rchild=NULL;
    return 1;
  
  else if(k==T->key)
    return 0;
  else if(k<T->key)
    return BST_Insert(T->lchild,k);
  else 
    return BST_Insert(T->rchild,k);

分析：
不同的str[]序列可能得到同款二叉排序树，也可能得到不同的二叉排序树。
实例

4. 二叉排序树的删除

思想：
（1）先搜索找到目标节点：
① 如果被删除节点是叶子结点，则直接删除，不会破坏二叉排序树的性质
② 若z结点只有一棵左子树或右子树，则让z的子树成为z父节点的子树，代替z的位置。
③ 若z结点存在左右子树，则令z的直接后继（或直接前驱）代替z，然后从二叉排序树中山区这个直接后继（或直接前驱），这样就转换成了①或②情况。【z的后继：z的右子树中最左下结点，该结点一定没有左子树；z的前驱：z的左子树中最右下结点，该结点一定没有右子树】

5. 查找效率分析

查找长度—在查找算法中，需要对比关键字的次数称为查找长度，反映了查找操作时间复杂度。
若树高h，为了找到最下层的结点需要对比h次。
最好情况：n个结点的二叉树最小高度为log2n+1【向下取整】
最坏情况：每个结点只有一个分支，树高h=节点数n，平均查找长度=O(n)
实例
① 查找成功的平均查找时间

查找失败的平均查找长度ASL

二、平衡二叉树

（一）定义

简称平衡树（AVL树）—书上任意结点的左子树和右子树的高度之差不超过1。【G.M.Adelson-Velsky和E.M.Landis】
结点的平衡因子=左子树高-右子树高。
平衡二叉树结点的平衡因子的值只可能是-1,0或1。只要有任意一点平衡因子绝对值大于1，则不是平衡二叉树。
构造结构

//二叉排序树结点 
typedef struct AVLNode
    int key;
    int balance;//平衡因子
    struct AVLNode *lchild,*rchild;
AVLNode,*AVLTree;

（二）操作

1. 二叉平衡树的插入

（1）最小不平衡子树：从插入点往回找到第一个不平衡节点，调整以该结点的根的子树。
（2）插入后查找路径上的所有结点的平衡因子都会发生变化。
（3）寻找最小不平衡子树

（4）只需要将最小不平衡子树调整平衡，其他祖先结点都会恢复平衡。
（5）调整不平衡子树
① LL（在A的左孩子的左子树中插入导致不平衡）
右单旋转：由于在结点A的左孩子的左子树上插入了新结点，A的平衡因子从1增至2，导致以A上为根的子树失去平衡，需要一次向右的旋转操作。将A的左孩子B向右上旋转代替A成为根结点，将A结点向右下旋转成为B的右子树的根结点，而B的原右子树则作为A结点的左子树。

②RR（在A的右孩子的右子树中插入导致不平衡）
左单旋转：由于在结点A的右孩子的右子树上插入了新结点，A的平衡因子从-1增至-2，导致以A上为根的子树失去平衡，需要一次向左的旋转操作。将A的右孩子B向左上旋转代替A成为根结点，将A结点向左下旋转成为B的左子树的根结点，而B的原左子树则作为A结点的右子树。

③ LR（在A的左孩子的右子树中插入导致不平衡）
先左旋后右旋：由于在A的左孩子L的右子树R上插入新结点，A的平衡因子由1增至2，导致以A为根的子树失去平衡，需要进行两次旋转操作，先左旋后右旋。先将A结点的左孩子B的右子树的根结点C向左上旋转提升到B结点的位置，然后再把该C结点向右上旋转提升到A结点的位置。

④ RL（在A的右孩子的左子树中插入导致不平衡）
先右后左旋转
由于在A的右孩子L的左子树R上插入新结点，A的平衡因子由-1增至-2，导致以A为根的子树失去平衡，需要进行两次旋转操作，先右旋后左旋。先将A结点的右孩子B的左子树的根结点C向右上旋转提升到B结点的位置，然后再把该C结点向左上旋转提升到A结点的位置。
（6）代码

实现f向右下旋转，p向右上旋转：其中f是父节点，p为左孩子，gf为f的父节点

  f->lchild=p->rchild;
    p->rchild=f;
    gf->lchild/rchild = p;

实现f向左下旋转，p向左上旋转：其中f是父节点，p为右孩子，gf为f的父节点

  f->rchild=p->lchild;
    p->lchild=f;
    gf->lchild/rchild = p;

查找效率分析
（1）若树高为h，则最坏情况下，查找一个关键字最多需要对比h次，即查找操作的时间复杂度不可能超过O(h)。
（2）平衡二叉树——树上任意结点的左子树和右子树的高度之差不超过1。
（3）假设以nh表示深度为h的平衡树中含有最少节点数。则有n0=0，n1=1，n2=2，并且有nh=nh-1+nh-2+1。【n3=4，n4=7，n5=12，n=9，则说明高最大为4】
可以证明含有n个结点的平衡二叉树的最大深度为O(log2n)，平衡二叉树的平均查找长度为O(log2n)。

三、哈夫曼树

1. 带权路径长度

（1）结点的权：有某种现实含有的数值（如：表示结点的重要性等）
（2）结点的带权路径长度：从树的根到该结点的路径长度（经过的边数）与该结点上权值的乘积。
（3）树的带权路径长度：树中所有叶结点的带权路径长度之和wpl
（4）在含有n个带权也结点的二叉树中，其中带权路径长度最小的二叉树称为哈夫曼树，也称最优二叉树。

2.哈夫曼树的构造

（1）给定n个权值分别为w1, w2,…, wn的结点，构造哈夫曼树的算法描述如下：
1）将这n个结点分别作为n棵仅含一个结点的二叉树，构成森林F。
2）构造一个新结点，从F中选取两棵根结点权值最小的树作为新结点的左、右子树，并且将新
结点的权值置为左、右子树上根结点的权值之和。
3）从F中删除刚才选出的两棵树，同时将新得到的树加入F中。
4）重复步骤2）和3），直至F中只剩下一棵树为止。

（2）规律：

每个初始结点最终都成为叶结点，且权值越小的结点到根结点的路径长度越大
哈夫曼树的结点总数为2n − 1
哈夫曼树中不存在度为1的结点。
哈夫曼树并不唯一，但WPL必然相同且为最优

3. 哈夫曼编码

100个选择题的答案
（1）固定长度编码——每个字符用相等长度的二进制位表

ASCII编码
A——0100 0001
B——0100 0010
C——0100 0011
D——0100 0100
8*100=800
每个字符用长度为2的二进制表示
假设，100题中有80题选C，10题选A，8题选B，2题选D
所有答案的二进制长度=802+102+82+22=200 bit
（2）可变长度编码——允许对不同字符用不等长的二进制位表示
若没有一个编码是另一个编码的前缀，则称这样的编码为前缀编码

（3）有哈夫曼树得到哈夫曼编码——字符集中的每个字符作为一个叶子结点，各个字符出现的频度作为结点的权值，根据之前介绍的方法构造哈夫曼树.
（4）注意：
① 哈夫曼树不唯一，因此哈夫曼编码不唯一。
② 哈夫曼编码可用于数据压缩。

以上是关于王道数据结构5.2（树的应用）的主要内容，如果未能解决你的问题，请参考以下文章