浅谈K-D Tree

Posted 2021-02-09 akmer

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了浅谈K-D Tree相关的知识，希望对你有一定的参考价值。

初步认识(K-D) (Tree)

(K-D) (Tree)是一种基于空间分割的二叉树形数据结构，一般用于高维信息检索。因为(OI)中很多问题都能转化为高维信息检索，所以(K-D) (Tree)的用途十分广泛。

(K-D) (Tree)树高严格为(logn)每一个结点都代表着一个高维信息点。每一棵子树表示的范围是该子树内所有点的(k)维正交包围盒，左右子树代表的范围不相交。

建树

(K-D) (Tree)一般采用中位数循环切割的方式建树。假设当前结点是以第(x)维中位数分割成两棵子树的，那么当前节点的儿子结点就应该用第((x+1)mod) (k)维中位数来切割。以(k=2)为例：

技术图片

总之就是切完(x)就切(y)啦。求中位数可以用( m std::nth)_( m elememt())，复杂度(O(n))，会把中位数放到序列中间来。

建树总时间复杂度：(T(n)=2T(n/2)+O(n)=O(nlogn))

插入

就像二叉查找树一样一直搜索到底，作为叶子插入。但是数据不随机的时候有可能会使树退化成链，所以需要用到替罪羊树重构的方式保持平衡。均摊(O(log^2n))。由于保持平衡的代价较大，所以不强制在线的时候，应该把插入换成激活，也就是先把这个点扔里面，但是处于未激活的状态，点上的信息不进入统计范围。激活之后就算是一个实实在在存在的结点了。

删除

不能真的从树里删掉某个点，因为那样会改变树的结构。用激活的反操作把它标记掉，如果要重构树的时候再清掉。

正交范围查询

从根开始查询，如果当前子树与查询范围没有交集则直接退出，被完全包含就统计信息之后直接退出，否则递归访问左右子树。(k)维的(k-d) (tree)正交范围查询的复杂度是(O(n^{frac{k-1}{k}}))，(k=2)为例：

假设查询范围只有上边界和右边界，两层孩子一共(4)棵子树，每棵(frac{n}{4})个点。这(4)棵子树中有一棵完全被包含=(O(1))，(2)棵子树只有一个边界=(2F(frac{n}{4}))，还有一棵与原问题一致=(T(frac{n}{4}))。

对于只有一个边界的问题来说，该边界只会与两棵子树相交，所以(F(n)=2F(frac{n}{4})+O(1)=O(sqrt{n}))

所以(2)维(k-d) (tree)的正交范围查询复杂度为(T(n)=T(frac{n}{4})+O(sqrt{n})=O(sqrt{n}))

(K-D) (Tree)与传统树套树的比较

空间复杂度为(O(n))，不容易被卡空间。

结构简单并且支持复杂的操作。

便于剪枝，因为寻址快，效率一般更好。

以上是关于浅谈K-D Tree的主要内容，如果未能解决你的问题，请参考以下文章

浅谈K-D Tree

初步认识(K-D) (Tree)

建树

插入

删除

最近点查询

正交范围查询

(K-D) (Tree)与传统树套树的比较