堆树中的第 K 个元素
Posted
技术标签:
【中文标题】堆树中的第 K 个元素【英文标题】:K-th element in a heap tree 【发布时间】:2012-11-30 13:26:31 【问题描述】:我有一个堆(像二叉树一样实现:每个节点都有两个指向子节点的指针和一个指向父节点的指针)。
在给定元素数量的情况下,如何找到第 k 个元素(按 BFS 顺序)?我认为它可以在 O(logn) 时间内完成..
【问题讨论】:
【参考方案1】:(我假设“第 k 个元素(按 BFS 顺序)”是指从输入的从上到下、从左到右扫描的角度来看的第 k 个元素。)
既然您知道二叉堆是一棵完全二叉树(可能在最后一层除外),那么您就知道树的形状是一棵具有一定高度的完全二叉树(包含 2k 一些 k) 的节点,从左到右填充了一些节点。当您写出图片中节点的数量时,这些树的一个非常漂亮的属性就会出现,对值进行单索引:
1
2 3
4 5 6 7
8 9 10 11 12 13 14 15
请注意,每一层都以一个为 2 的幂的节点开始。因此,假设您要查找数字 13。不大于 13 的 2 的最大幂是 8,因此我们知道 13 必须出现在行中
8 9 10 11 12 13 14 15
我们现在可以利用这些知识对从 13 到树根的路径进行逆向工程。例如,我们知道 13 在这一行数字的后半部分,这意味着 13 属于根的右子树(如果它属于左子树,那么我们将在包含8、9、10 和 11。)这意味着我们可以直接从根开始,扔掉一半的数字来得到
12 13 14 15
我们现在位于树中的节点 3。那么我们是向左还是向右呢?嗯,13 在这些数字的前半部分,所以我们现在知道我们需要下降到节点 3 的左子树。这将我们带到节点 6,现在我们剩下了前半部分数字:
12 13
13 在这些节点的右半部分,所以我们应该向右下降,带我们到节点 13。瞧!我们在那里!
那么这个过程是如何运作的呢?好吧,我们可以使用一个非常非常可爱的技巧。让我们用二进制写出我们上面的树:
0001
0010 0011
0100 0101 0110 0111
1000 1001 1010 1011 1100 1101 1110 1111
^^^^
我已经指出了节点 13 的位置。我们的算法按以下方式工作:
-
找到包含节点的层。
虽然不在相关节点上:
-
如果节点位于其所在层的前半部分,则向左移动并丢弃范围的右半部分。
如果节点位于其所在层的后半部分,则向右移动并丢弃范围的左半部分。
让我们想想这在二进制中意味着什么。找到包含节点的层相当于找到数字中设置的最高有效位。在 13 中,有二进制表示 1101,MSB 是 8 位。这意味着我们处于从 8 开始的层中。
那么我们如何确定我们是在左子树还是右子树呢?好吧,要做到这一点,我们需要看看我们是在这一层的前半部分还是后半部分。现在来看一个可爱的技巧 - 看看 MSB 之后的下一位。如果该位设置为 0,则我们处于范围的前半部分,否则我们处于范围的后半部分。因此,我们可以通过查看数字的下一位来确定我们在范围的哪一半!这意味着我们可以通过查看数字的下一位来确定要下降到哪个子树。
完成此操作后,我们可以重复此过程。我们在下一个级别做什么?好吧,如果下一位是零,我们向左走,如果下一位是一,我们向右走。看看这对 13 意味着什么:
1101
^^^
|||
||+--- Go right at the third node.
||
|+---- Go left at the second node.
|
+----- Go right at the first node.
换句话说,我们可以通过查看 MSB 之后的数字位来拼出从树根到我们所讨论节点的路径!
这总是有效吗?你打赌!让我们试试数字 7。它具有二进制表示 0111。MSB 在 4 的位置。使用我们的算法,我们会这样做:
0111
^^
||
|+--- Go right at the second node.
|
+---- Go right at the first node.
从我们的原始图片来看,这是正确的道路!
这里是这个算法的一些粗略的 C/C++ 伪代码:
Node* NthNode(Node* root, int n)
/* Find the largest power of two no greater than n. */
int bitIndex = 0;
while (true)
/* See if the next power of two is greater than n. */
if (1 << (bitIndex + 1) > n) break;
bitIndex++;
/* Back off the bit index by one. We're going to use this to find the
* path down.
*/
bitIndex--;
/* Read off the directions to take from the bits of n. */
for (; bitIndex >= 0; bitIndex--)
int mask = (1 << bitIndex);
if (n & mask)
root = root->right;
else
root = root->left;
return root;
我还没有测试过这段代码!套用 Don Knuth 的话说,我只是在概念上证明了它做了正确的事情。我这里可能有一个错误。
那么这段代码有多快?嗯,第一个循环一直运行,直到找到大于 n 的 2 的第一次幂,这需要 O(log n) 时间。循环的下一部分一次通过 n 的位向后计数,在每一步做 O(1) 工作。因此,整个算法总共需要 O(log n) 时间。
希望这会有所帮助!
【讨论】:
是的,这正是我想要的!很好的解释,谢谢! @SettembreNero:您将堆实现为二叉树有什么原因吗?在通常的表示中,堆包含在单个数组中,并且所有边都被隐式定义——这不仅是对内存的更好利用,而且允许使用简单的x[k]
找到第 k 个元素。 :)
第一个原因:这是一个家庭作业 :) 而且,我认为它更“动态”:只需分配一个新节点就可以添加新元素 - 在数组实现中它需要重新分配整个数组的
精彩的解释,我仍然想知道为什么这样的帖子得到的赞数最少。以上是关于堆树中的第 K 个元素的主要内容,如果未能解决你的问题,请参考以下文章