为啥我们不使用 2-3 或 2-3-4-5 树?
Posted
技术标签:
【中文标题】为啥我们不使用 2-3 或 2-3-4-5 树?【英文标题】:Why dont we use 2-3 or 2-3-4-5 trees?为什么我们不使用 2-3 或 2-3-4-5 树? 【发布时间】:2012-02-04 15:19:14 【问题描述】:我对@987654321@如何在操作后保持高度平衡属性操作有一个基本的了解,以确保即使是最坏情况的操作也是O(n logn)。
但我不太了解它,不知道为什么只有 2-3-4?
为什么不是 2-3 或 2-3-4-5 等?
【问题讨论】:
如果您曾经实现过 2-3-4 或红黑树,您就会知道正确然后进行测试并非易事。甚至还有一个简化版的红黑树,AA-tree,它的对称性不如红黑树,但似乎是实现复杂度较低的一个很好的替代方案。当您需要更多子节点或更扁平的树时,您可以选择 b-tree 并以统一的方式显式支持许多子节点。 另外,总是担心数据局部性和每个节点的开销(由于分配器成本)。在实践中,这类问题往往会鼓励基于数组(例如哈希表)的解决方案。 【参考方案1】:实现 2-3-4 树通常需要多个类(2NODE、3NODE、4NODE),或者您只有具有一组项目的 NODE。在多个类的情况下,您会浪费大量时间来构建和销毁节点实例,并且重新设置它们的父级很麻烦。如果您使用带有数组的单个类来保存项目和子项,那么您要么不断地调整数组的大小,这同样是浪费的,要么您最终将一半以上的内存浪费在未使用的数组元素上。与红黑树相比,它的效率不是很高。
红黑树只有一种节点结构。由于红黑树与 2-3-4 树具有对偶性,因此 RB 树可以使用与 2-3-4 树完全相同的算法(不需要 Cormen、Leiserson 和 Rivest 中描述的愚蠢的、令人困惑/复杂的实现)到不比 2-3-4 算法复杂的 AA 树。)
因此,红黑树是因为它们易于实施以及内存/CPU 效率。 (AVL 树也很不错。它们会产生更平衡的树,并且简单地编写代码很愚蠢,但由于过于频繁地工作而只能保持稍微紧凑的树,因此它们的效率往往较低。)
哦,还有 2-3-4-5-6... 等没有完成,因为没有任何收获。 2-3-4 比 2-3 树有净增益,因为它们可以在没有递归的情况下轻松完成(递归往往效率较低,尤其是当它不能尾递归编码时)。但是,B-Trees 和 Bplus-Trees 几乎是 2-3-4-5-6-7-8-9 等树,其中选择了节点的最大大小 n,以便可以将 n 条记录存储在单个磁盘扇区。 (即每个磁盘扇区是树中的一个节点,扇区的大小等于节点中存储的项目数。)这是因为在内存中线性搜索 512 条记录的时间仍然比向下遍历快得多树中需要另一个磁盘查找/获取的级别。并且 O(512) 仍然是 O(1),因此为树维持 O(lg n)。
【讨论】:
【参考方案2】:说实话,我不知道有 2-3-4 棵树。在我的数据结构课上,我们学习了 2-3 棵树,老实说,我们大多数人都在练习的湿部分实现了 AVL 树。
但显然,这种类型的树有一个概括: (a,b) tree.
【讨论】:
有趣!这意味着我们不能有 3-4 棵树,我不知道为什么? 我也不确定。这似乎是一棵相当理论的树,而不是通常探索的树……网上的 (a,b) 树并不多。【参考方案3】:在我的算法课程中,他们告诉我们,它们通常用于从硬盘访问内存 - 称为 B/B+ 树。您制作存储可用内存大小的树,这样做可以最大限度地减少磁盘操作中的簧片数量(如果您使用存储例如 10^8 个元素的节点制作 B,则您只需要来自磁盘操作的 log_10^8(n) 簧片到在硬盘上找到什么都不是的东西。所以你称之为 2-3-4-5-... 树的东西实际上是广泛的解决方案。
【讨论】:
以上是关于为啥我们不使用 2-3 或 2-3-4-5 树?的主要内容,如果未能解决你的问题,请参考以下文章