学大伟业 Day 6 培训总结

Posted misakaazusa

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了学大伟业 Day 6 培训总结相关的知识,希望对你有一定的参考价值。

今天接着昨天的继续讲数据结构

今天先是 分块

在统计问题中,尤其是序列问题,经常涉及到区间的操作,比如修改一段区间的元素,询问某个区间的元素的信息。

如果每次都对一整个区间的每一个元素进行操作的话,那可能就很笨重,所以怎么快速地统计某一段区间的信息就成为了问题所在。

我们考虑把整个序列分成若干个区间,每一个区间称为一个“块”,这样,修改或者询问的每一个区间都能被表示为若干个连续的整块和若干个单个元素的拼接。

对于连续的整块,我们直接询问或者修改这个整块的信息即可,对于单个的元素我们暴力遍历一遍。

如果我们设块的大小为S,块的个数为C的话,那么显然S*C≈N,并且一个区间会被分为不超过C个整块和不超过2S个单个元素,显然,取S=C=n^0.5最优。

分块的思想并不仅仅适用于序列,它实质上用到了一种均衡的思想。

分块算法是一种很常见的根号算法,一般它的时间复杂度会带根号。 

分块和线段树的区别在于,分块算法可以维护一些线段树维护不了的东西,例如单调队列等,线段树能维护的东西必须能够进行信息合并,而分块则不需要。

不过,它们也有共同点,分块和线段树一样,分块需要支持类似标记合并的东西。 

简单来说,分块算法就是优化过后的暴力。

至于代码...大概是这个样子...(嗯我不会告诉你我直接粘贴的mzx的资源)

 1 Block{
 2     int n,a[MAXN],belong[MAXN];
 3     int S,C,st[MAXN],ed[MAXN],sum[MAXN],delta[MAXN];
 4     
 5     void pretreat(){
 6         S=int(sqrt(double(n)));
 7         for(int i=1;i<=n;i+=S){
 8             st[++C]=i;
 9             ed[C]=min(i+S-1,n);
10         }
11         for(int i=1;i<=C;i++)
12             for(int j=st[i];j<=ed[i];j++)
13                 belong[j]=i,sum[j]+=a[i];
14     }
15     
16     int update(int x,int k){
17         a[x]+=k;
18         sum[belong[x]]+=k;
19     }
20     
21     int query(int x,int y){
22         int l=belong[x],r=belong[y],ans=0;
23         if(l==r){
24             for(int i=x;i<=y;i++)
25                 ans+=a[i]+delta[belong[i]];
26         }
27         else{
28             for(int i=x;i<=ed[l];i++)
29                 ans+=a[i]+delta[belong[i]];
30             for(int i=l+1;i<r;i++)
31                 ans+=sum[i]+delta[i]*(ed[i]-st[i]+1);
32             for(int i=st[r];i<=y;i++)
33                 ans+=a[i]+delta[belong[i]];
34         }
35         return ans;
36     }
37     
38 }

至于线段树...本博客里面已经写过一篇了,这里不再细说。

链接:http://www.cnblogs.com/MisakaAzusa/p/8485726.html

那么摘抄一下mxz ppt里面对线段树的解释

线段树是一种较为高级的数据结构,它用来维护区间的信息,我把它理解为更高级的一种分块方式:

根节点代表一整个区间[1,n],然后把它从中间等分为两个区间,作为它的两个儿子,然后再将这两个区间等分……如此递归下去,我们就构造出了一棵线段树。

线段树有多少个结点呢?

第1层有1个,第2层有2个,第3层有4个……第i层有2^(i-1)个。 但是最多只有O(logn)层,所以实际上节点数大约是2n个。

单点修改:

以维护最大值为例,我们在每个结点存储这个结点所对应的区间中所有元素的最大值,怎么初始化呢?

很简单,每个叶子结点都是一个长度为1的区间,对着序列直接DFS建树,叶子节点的值能直接确定,而一个非叶子结点的区间最大值就是它的两个儿子的最大值取更大那个,因为每个结点所对

应的区间都刚好是它另个儿子所对应的区间的合并。

于是,如果我们要修改某一个点的值,那么直接dfs到它所对应的那个叶子结点,在回溯的过程中更新包含这个点的区间即可,这些结点就是从根到这个叶子结点的一条链。

区间查询:

如果我们要询问一个区间,该怎么办?

回想一下分块的处理方法,一个区间能被划分为若干个整块和若干个点。

但是在线段树中,“点”也是一个块。 所以在询问区间时,我们直接对线段树进行DFS,如果一个结点所对应的区间被询问的区间完全覆盖了,那就把它的信息统计上并且不再往下搜索。

与线段树类似的,还有树状数组

树状数组(BIT)是一个查询和修改复杂度都为log(n)的数据结构。主要用于查询任意两位之间的所有元素之和,但是每次只能修改一个元素的值;经过简单修改可以在log(n)的复杂度下
进行范围修改,但是这时只能查询其中一个元素的值(如果加入多个辅助数组则可以实现区间修改与区间查询)。
树状数组和线段树很像,但能用树状数组解决的问题,基本上都能用线段树解决,而线段树能解决的树状数组不一定能解决。相比较而言,树状数组效率要高很多。

 这里拿luogu P3374 树状数组模板为例

 1 #include<iostream>
 2 #include<cstdio>
 3 #include<cstring>
 4 using namespace std;
 5 int n,m;
 6 int tree[500070],a[500070];
 7 int lowbit(int x)
 8 {
 9     return x&-x;
10 }
11 void add(int k,int num)//给k位置的数值加num
12 {
13     while(k<=n)
14     {
15         tree[k]+=num;
16         k+=lowbit(k);
17     }
18 }
19 int sum(int k)//前缀和
20 {
21     int s=0;
22     while(k)
23     {
24         s+=tree[k];
25         k-=lowbit(k);
26     }
27     return s;
28 }
29 int main()
30 {
31     scanf("%d%d",&n,&m);
32     for(int i=1;i<=n;i++)
33     {
34         scanf("%d",&a[i]);
35         add(i,a[i]);
36     }
37     for(int i=1;i<=m;i++)
38     {
39         int c;scanf("%d",&c);
40         if(c == 1)
41         {
42             int x,k;
43             scanf("%d%d",&x,&k);
44             add(x,k);
45         }
46         else
47         {
48             int x,y;scanf("%d%d",&x,&y);
49             printf("%d\\n",sum(y)-sum(x-1));
50         }
51     }
52     return 0;
53 }

 

以上是关于学大伟业 Day 6 培训总结的主要内容,如果未能解决你的问题,请参考以下文章

学大伟业 Day 3 培训总结

学大伟业 Day 1 培训总结

学大伟业 Day 2 培训总结

大数据培训课程好学吗

学大数据选自学还是培训呢

一起重新开始学大数据-Hbase篇-day 57 Hbase调优