数据结构与算法-二叉树(Binary Tree)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据结构与算法-二叉树(Binary Tree)相关的知识,希望对你有一定的参考价值。

参考技术A     名词解释

        节点: 每个元素

        父子关系: 用来连线相邻节点之间的关系

        父节点: A节点就是B节点的父节点

        子节点:  B节点就是A节点的子节点

        兄弟节点: B、C、D这三个节点的父节点是同一个节点

        根结点: 没有父节点的节点

        叶子结点: 没有子节点的节点

        节点的高度: 节点到叶子结点到最长路径(边数)  (计数起点为0, 从下往上)

        节点的深度: 根节点到这个节点经历过的边个数  (计数起点为0, 从上往下)

        节点的层数:     节点到深度 + 1  (计数起点为1)

        树的高度: 根节点的高度

    特点

        最常用的树数据结构

        每个节点最多有两个子节点(左子节点、右子节点)

         满二叉树: 叶子节点全都在最底层,除了叶子节点之外,每个节点都有左右两个子节点

         完全二叉树:  叶子节点都在最底下两层,最后一层的叶子节点都 靠左排列 ,并且除了最后一层,其他层的节点个数都要达到最大

        二叉树存储方式

            数组顺序存储法

                通过数组下标来顺序存储数据 (i表示当前节点深度,从0开始)

                根节点: i = 1,左节点:2 * i,右节点: 2 * i + 1,父节点: i / 2

                完全二叉树采用此方式节省内存空间

            链式存储法

                每个节点需要存储三分数据:当前节点数据、左节点指针、右节点指针,比较占用空间                

            遍历

                常用方式

                前序遍历: 树任意节点,先打印当前节点,再打印它的左子树,最后打印它的右子树

                中序遍历: 树任意节点,先打印它的左子树,再打印当前节点,最后打印它的右子树

                后序遍历: 树任意节点,先打印它的左子树,再打印它的右子树,最后打印当前节点

                二叉树的前、中、后序遍历就是一个递归的过程

                时间复杂度是O(n)

                    每个节点最多被访问两次,遍历操作的时间复杂度跟节点的个数n成正比

特点

    二叉查找树为实现快速查找而生,支持快速查找一个数据、快速插入、快速删除一个数据

    特殊结构: 其左子树每个节点的值 < 树的任意一个节点的值 < 其右子树每个节点的值

            先取根节点,如果它等于要查找的数据,那就返回。

            如果要查找的数据比根节点的值小,那就在左子树中递归查找;

            如果要查找的数据比根节点的值大,那就在右子树中递归查找

            一般插入的数据在叶子节点上,从根节点开始依次比较要插入的数据和节点的大小关系

            如果插入数据比节点的数值大,并且节点的右子树为空,将新数据插到右子节点位置;

            如果不为空,就再递归遍历右子树,查找插入位置。

            如果插入数据比节点的数值小,并且节点的左子树为空,将新数据插到左子节点位置;

            如果不为空,就再递归遍历左子树,查找插入位置。

        针对要删除节点的子节点个数的不同,需分三种情况来处理

        1.如果要删除的节点没有子节点,步骤如下: (如图中的删除节点55)

            只需将父节点中指向要删除节点的指针置为null

        2.如果要删除的节点只有一个子节点,步骤如下: (如图中删除节点13)

            只需将父节点中指向要删除节点的指针,让它指向要删除节点的子节点即可

        3.如果要删除的节点有两个子节点,步骤如下: (如图中的删除节点18)

            首先,需要找到这个节点的右子树中的最小节点,把它替换到要删除的节点上;

            然后,再删除掉这个最小节点,因为最小节点肯定没有左子节点        

            删除操作,有个优化方案: 就是单纯将要删除的节点标记为“已删除”,

            这种方案删除操作就变简单很多,但是比较浪费内存空间

        支持快速地查找最大节点和最小节点、前驱节点和后继节点

        另外一种重要特性: 

            中序遍历二叉查找树,可以输出有序的数据序列,时间复杂度为O(n)

            因此,二叉查找树也叫作二叉排序树

        以上几种操作都默认树中节点存储的都是数字,而且都是不存在键值相同的情况

        实际应用场景中采用对象的某个字段作为键值来构建二叉查找树,其他字段称为卫星数据

        如果存储的两个对象键值相同,两种解决方案

        1.把值相同的数据都存储在同一个节点(采用链表或支持动态扩容的数组等数据结构)   

        2.每个节点只存储一个数据,把这个新插入的数据当作大于这个节点的值来处理,如下图:

        查找操作

            当查找数据时遇到值相同的节点,继续在右子树中查找,直到遇到叶子节点才停止。

            这样就把键值等于要查找值的所有节点都查找出来        

            删除操作

                先查找到每个要删除的节点,然后再按前面讲的删除操作的方法,依次删除

        对于同一组数据可构造不同二叉查找树。查找、插入、删除操作的执行效率都不一样

        图最左边树,根节点的左右子树极度不平衡,退化成链表,查找时间复杂度为O(n)

        最理想的情况,二叉查找树是一棵完全二叉树(或满二叉树)

        时间复杂度都跟树的高度成正比,也就是O(height)

        树的高度就等于最大层数减一,为了方便计算,我们转换成层来表示

        满二叉树: 下一层节点个数是上一层的2倍,第K层包含节点个数就是2^(K-1)

        完全二叉树: 假设最大层数是L,总的节点个数n,它包含的节点个数在1个到2^(L-1)个之间

            L的范围是[ , +1],完全二叉树的高度小于等于

            极度不平衡的二叉查找树,它的查找性能肯定不能满足我们的需求

        平衡二叉查找树: 树的高度接近logn,时间复杂度较稳定为O(logn)

    1.排序对比

        散列表中的数据是无序存储的,如果要输出有序的数据,需要先进行排序

        二叉查找树只需要中序遍历,就可以在O(n)的时间复杂度内,输出有序的数据序列

    2.性能稳定性对比

        散列表扩容耗时很多,而且当遇到散列冲突时,性能不稳定

        最常用的平衡二叉查找树的性能非常稳定,时间复杂度稳定在O(logn)

    3.时间复杂度对比

        散列表查找等操作时间复杂度是常量级,因存在哈希冲突,这个常量不一定比logn小

        另外加上哈希函数的耗时,也不一定就比平衡二叉查找树的效率高

    4.结构设计对比

        散列表构造比较复杂,需要考虑:散列函数设计、冲突解决办法、扩容、缩容等

        平衡二叉查找树只需要考虑平衡性,而且目前这个的解决方案较成熟、固定

    5.空间复杂度

        散列表: 避免过多散列冲突,装载因子不能太大,特别基于开放寻址法,否则浪费太多空间

            

        

以上是关于数据结构与算法-二叉树(Binary Tree)的主要内容,如果未能解决你的问题,请参考以下文章

226. Invert Binary Tree226.反转二叉树

LeetCode算法题-Diameter of Binary Tree(Java实现)

算法: 145. 后序遍历二叉树Binary Tree Postorder Traversal

算法: 144. 二叉树前序遍历Binary Tree Preorder Traversal

算法: 145. 后序遍历二叉树Binary Tree Postorder Traversal

算法: 144. 二叉树前序遍历Binary Tree Preorder Traversal