可持久化专题——浅谈主席树：可持久化线段树

Posted 2021-01-15 chenxiaoran666

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了可持久化专题——浅谈主席树：可持久化线段树相关的知识，希望对你有一定的参考价值。

前言

不得不说，可持久化数据结构真是太难了！

由于数据结构这东西真的太玄学了，学这个主席树我真的学了很久。

简介

主席树为什么叫主席树？据说因为它是一个名字缩写为(HJT)的神犇发明的，与当时主席的名字缩写一样......

主席树实质上就是一棵可持久化线段树，它的具体实现可以看下面。

让我们从值域线段树开始说起

要学主席树，我们就要先学值域线段树。

值域线段树的区间存的并不是节点信息，而是在值在某一范围内的数的个数。

技术分享图片

如图就是一棵值域线段树，其中1号节点存储的是大于等于1小于等于4的数字个数，2号节点存储的是大于等于1小于等于2的数字个数，3号节点存储的是大于等于3小于等于4的数字个数，4号节点存储的是等于1的数字个数，5号节点存储的是等于2的数字个数，6号节点存储的是等于3的数字个数，7号节点存储的是等于4的数字个数。

值域线段树的查询也挺简单的，若要查询这段区间内的第(k)大，只要比较当前元素的左子树大小加1（1是当前元素本身的大小）与询问的(k)，若大于等于，就访问左子树，否则将(k)减去当前元素的左子树大小加1，然后访问右子树。

~~这和平衡树有什么区别！！！~~

还有一个问题，就是值域线段树存储的区间范围是固定的，所以如果要查询区间第(k)大，我们就不能只用一棵值域线段树。

考虑建(n)棵值域线段树，每棵值域线段树存储区间([1,i])的信息，这样一来，要查询([l,r])的第(k)大时，只要在查询的过程中，将第(r)棵值域线段树的信息减去第(l-1)棵值域线段树的信息即可，这利用了前缀和的思想。
或许你会问，这有什么用？建(n)棵树，内存那么大，我平衡树第一个不服！

好吧，~~不服就不服~~，值域线段树还是有点用的，因为平衡树没法可持久化啊（可持久化(Treap)请走开）！

从值域线段树到主席树

知道了值域线段树，我们就可以开始尝试实现主席树了。

来研究一下下面两棵分别存储([1,3])和([1,4])区间信息的值域线段树（圆圈中为以该节点为根的子树大小）。
技术分享图片

仔细观察可得，我们每次新加入一个节点，有影响的只有图中(color{red}{标红})的节点。

再仔细观察一下，这些节点都在一条链上（废话）。

那么，我们就会有一个大胆的想法：可不可以每次只新建一条链而不是一棵树，就像下面这样？

技术分享图片

这就是传说中的主席树了。

主席树的具体实现

当然，真正实现主席树时，还是有一些细节要注意的。

这里就不多讲了，直接上代码吧：（洛谷板子题）

#include<bits/stdc++.h>
#define max(x,y) ((x)>(y)?(x):(y))
#define min(x,y) ((x)<(y)?(x):(y))
#define LL long long
#define swap(x,y) (x^=y,y^=x,x^=y)
#define tc() (A==B&&(B=(A=ff)+fread(ff,1,100000,stdin),A==B)?EOF:*A++)
#define pc(ch) (pp_<100000?pp[pp_++]=(ch):(fwrite(pp,1,100000,stdout),pp[(pp_=0)++]=(ch)))
#define N 200000 
int pp_=0;char ff[100000],*A=ff,*B=ff,pp[100000];
using namespace std;
int n,Q,m,tot=0,rt[N+5],a[N+5],p[N+5];
struct Chairman_Tree
{
    int Son[2],Size;
}node[N<<6];
inline void read(int &x)
{
    x=0;int f=1;char ch;
    while(!isdigit(ch=tc())) f=ch^‘-‘?1:-1;
    while(x=(x<<3)+(x<<1)+ch-‘0‘,isdigit(ch=tc()));
    x*=f;
}
inline void write(int x)
{
    if(x<0) pc(‘-‘),x=-x;
    if(x>9) write(x/10);
    pc(x%10+‘0‘);
}
inline void Build(int &rt,int l,int r)//建出一棵初始时的的树，和传统的线段树几乎一样
{
    rt=++tot;//新建一个节点，动态开点也是主席树中特别重要的
    int mid=l+r>>1;
    if(!(l^r)) return;
    Build(node[rt].Son[0],l,mid),Build(node[rt].Son[1],mid+1,r);//分别建树
}
inline void NewPoint(int &rt,int lst,int l,int r,int val)//新建一个节点（准确来说，应该是新建一条链）
{
    node[rt=++tot]=node[lst],++node[rt].Size;//动态开点，先复制原先的节点，然后将子树大小加1
    int mid=l+r>>1;
    if(!(l^r)) return;
    if(val<=mid) NewPoint(node[rt].Son[0],node[lst].Son[0],l,mid,val);//如果插入的新值比当前元素小（或等于），那么就新建一个左儿子
    else NewPoint(node[rt].Son[1],node[lst].Son[1],mid+1,r,val);//否则，新建一个右儿子
}
inline int Query(int rt1,int rt2,int l,int r,int k)//区间查询，相当于同时在两棵值域线段树上询问
{
    int mid=l+r>>1;
    if(!(l^r)) return l;//如果l与r相等，就返回l
    if(node[node[rt2].Son[0]].Size-node[node[rt1].Son[0]].Size>=k) return Query(node[rt1].Son[0],node[rt2].Son[0],l,mid,k);//如果当前左子树大小加1大于等于询问的k，那么访问左子树
    else return Query(node[rt1].Son[1],node[rt2].Son[1],mid+1,r,k-node[node[rt2].Son[0]].Size+node[node[rt1].Son[0]].Size);//否则，将k减去当前左子树大小加1
}
inline int num(int x)//求出一个数离散化后的值，一个二分的过程
{
    int l=1,r=m;
    while(l<=r)
    {
        int mid=l+r>>1;
        if(p[mid]==x) return mid;
        else if(p[mid]>x) r=mid-1;
        else l=mid+1;
    }
}
int main()
{
    register int i;
    for(read(n),read(Q),i=1;i<=n;++i) read(a[i]),p[i]=a[i];
    for(sort(p+1,p+n+1),Build(rt[0],i=1,m=unique(p+1,p+n+1)-p-1);i<=n;++i) NewPoint(rt[i],rt[i-1],1,m,num(a[i]));//将元素离散化，新建一棵树以及n条链，注意存储每条链的根节点的编号
    for(i=1;i<=Q;++i)//询问
    {
        int x,y,k;
        read(x),read(y),read(k),write(p[Query(rt[x-1],rt[y],1,m,k)]),pc(‘
‘);//利用前缀和思想
    }
    return fwrite(pp,1,pp_,stdout),0;
}

以上是关于可持久化专题——浅谈主席树：可持久化线段树的主要内容，如果未能解决你的问题，请参考以下文章

浅谈主席树

可持久化线段树（主席树）

P3834 模板可持久化线段树 1（主席树）

可持久化线段树/主席树（静态）

可持久化线段树（主席树）