OI算法竞赛常用套路及优化手段

Posted shenben

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了OI算法竞赛常用套路及优化手段相关的知识,希望对你有一定的参考价值。

 

 

经典的O3优化(一般写在开头)

 

#pragma GCC optimize("O3")
#pragma G++ optimize("O3")

 

 

G++手动扩大栈(写在main的开始)

int size = 256 << 20; // 256MB  
char *p = (char*)malloc(size) + size;  
__asm__("movl %0, %%esp
" :: "r"(p));

 

 

C++手动扩大栈(一般比较少起作用,推荐上面那个)

 

#pragma comment(linker, "/STACK:102400000,102400000")

 

G++ 64位手动扩大栈

extern int main2(void) __asm__ ("main2"); 
int main2(){ exit(0); }//在这里写main函数
int main(){
	int size=64<<20; char *p=(char*)malloc(size)+size;  
    __asm__ __volatile__("movq  %0, %%rsp
"  "pushq $exit
"   "jmp main2
"  :: "r"(p)); 
}


读入优化

inline int rd(int& X){
    char ch=X=0;
    for(;ch<‘0‘ || ch>‘9‘;ch=getchar());
    for(;ch>=‘0‘&&ch<=‘9‘;ch=getchar()) X=(X<<3)+(X<<1)+ch-‘0‘;
    return X;
}

 

 

更快的读入优化

 

char str[10000001]; int stl=0;
inline int rd(int& X){
    char ch=X=0;
    for(;ch<‘0‘ || ch>‘9‘;ch=str[stl++]);
    for(;ch>=‘0‘&&ch<=‘9‘;ch=str[stl++]) X=(X<<3)+(X<<1)+ch-‘0‘;
    return X;
}
int main(){
	fread(str,10000000,1,stdin);
}


如果输入文件较大以上方法可以把ch=str[stl++]改成自己实现的getchar,具体代码如下

 

 

#define SIZE 1000000 
char str[SIZE]; int stl=SIZE;
inline char getch(){
	return stl==SIZE?fread(str,SIZE,1,stdin),str[stl=0]:str[stl++];
}
inline int rd(int& X){
    char ch=X=0;
    for(;ch<‘0‘ || ch>‘9‘;ch=getch());
    for(;ch>=‘0‘&&ch<=‘9‘;ch=getch()) X=(X<<3)+(X<<1)+ch-‘0‘;
    return X;
}

 

 

线段树和树状数组记得使用位运算

ST表

不要用math库的log!自己预处理!

对于s[i][j]=f(s[i][j-1],s[i+(1<<j-1)][j-1]),我们将i,j的顺序调换一下可以提高效率

特别是在二维ST表效果显著,速度提升四倍有多

 

取模

首先不得不说把模数写成变量是不太好的做法。。。

我们可以

 

#define M 1000000007
const int M=1000000007

 

 

如果题目要求输入模数呢?

我们还是可以

 

int main(){
	int p; scanf("%d",&p);
	const int Mod=p;
}


如果只有加法,我们考虑判定性取模即可

 

 

int mod(int x){ return x>Mod?x-Mod:x; }

 

 

空间优化,记得C++有一个不常用的东西:short

在64位机器上少用指针因为它和long long一样费空间

 

对于一些奇怪的64位的OJ,我们可以使用__int128来过一些毒瘤数论题(比如对10^18取模)

 

关于memset和memcpy以及memmove

这几个函数效率都非常高,比循环的速度快很多

其实用法也很简单,比如原code是这样的

 

for(int i=l;i<=r;++i) a[i]=0;
for(int i=l;i<=r;++i) a[i]=b[i];
for(int i=l;l<=r;++i) a[i]=b[i],b[i]=0;

我们可以改成

 

 

memset(a+l,0,r-l+1<<2);
memcpy(a+l,b+l,r-l+1<<2);
memmove(a+l,b+l,r-l+1<<2);


注意,左移的位数和a,b的类型有关,这里默认为int,sizeof(int)=4,所以就是左移2(乘4)

 

如果不知道a,b类型所占字节数,可以改成如下

 

memset(a+l,0,(r-l+1)*sizeof(a[0]));
memcpy(a+l,b+l,(r-l+1)*sizeof(a[0]));
memmove(a+l,b+l,(r-l+1)*sizeof(a[0]));

 

 

关于Dijkstra算法

一般的教材(误)上面都说:只适用于所有边权为正的情况

而实际上,dijk+heap是可以在负权图上面跑的,而且比spfa还好写

具体实现,去掉vis数组就好了,虽然这样效率可能比不上spfa了(因为有一个log)

 

关于负权回路和spfa

如果题目就是要你找一个负环,我们可以直接将queue<int>改成priority_queue<int>

这样通常效率会提高很多(仅限于找负环,跑一般的最短路会慢)

如果还想更快,就把priority_queue<int> 的比较函数变成以下的函数(自己实现一个类似greater<int>的东西)dist是距离

 

inline bool cmp(int a,int b){ return dist[a]>dist[b]; }

 

 

数据结构

  • 在维护树上路径时,如果只是点的独立的加减,可以考虑用括号序来维护(拆成两部分)
  • 需要求树上很多路径中k近/距离和 一类,考虑点分治/在点分树上解决。
  • 子树求和可以转化为DFS序上区间求和
  • 树状数组可以区间查询/修改(差分)
  • 需要查询序列上区间数据结构,只要满足总和是可以接受的范围,可以用线段树,每个区间维护一个这样的数据结构(例如AC自动机等)
  • 多维偏序问题,排序可以降维,CDQ分治可以降维,剩下只需要树状数组/线段树
  • 树上连通块有概率出现,再加上和的次方,往往可以拆开来,变成任意选K个可重,有序的点,考虑贡献。
  • 当又需要分块,每个块维护数据结构时,块的大小考虑调整(不再一定是(sqrt n))(平衡规划)
  • 同理,对于图论中度数总和固定、多组询问查询的点数固定,查询点需要枚举出边,但可能一直查询度数比较大的点。此时考虑平衡规划。(询问点个数/度数 大于/小于(sqrt n)分开来做)
  • 对于点分治时两个不同的子树的结果混在一起需要判掉,可以考虑几种办法:
    • 在点分树上儿子记录当前点分树子树中的节点到父亲的结果,计算父亲时在这里减去。
    • 维护DFS序,两个子树对应两个无交的区间,可以考虑区间分裂一类的做法。
  • 对于有很多颜色的点,需要对相同颜色计算影响,可以把每个颜色拉出来在DFS序上搞事情(相邻+1,lca-1一类)
  • 如果又加上了深度限制,那么相当于除了DFS序这一维,还多出了深度这一维,可以考虑(主席树/CDQ分治/二维数据结构)
  • 对于这样一类问题:每个元素(边/点之类)具有权值/权值范围,每次只需要考虑权值是一定值/一定范围的元素的影响,可以考虑建立权值线段树,将元素的影响挂在线段树对应的所有区间上,查询就查询区间。
  • 当需要查询树上是否存在一条路径过两个点时,可以将路径端点记在DFS序上,然后两点子树查询,这就变成了两个区间数点的问题(二维偏序/扫描线/DFS动态树状数组维护增量)
  • 需要维护序列轮转问题时,不一定非要splay,如果轮转很特殊时可以采用线段树+预留空位的形式转化为单点修改。
  • 想要存储很多东西的0/1状态,且需要支持xor/or/and等操作时,bitset是个非常好的选择(计算复杂度可以除以32),别忘了bitset还有左移右移操作,可以用来处理+或-
  • 替罪羊树跑的很快。
  • 带旋转的平衡树是很难在内层套上线段树的,所以平衡树套线段树应考虑替罪羊树或treap
  • 一堆操作+询问的题,如果很容易处理一堆操作对一堆询问的贡献,可以考虑分治,你可以考虑权值/时间分治
  • 一棵Trie如果要维护+1异或,那么不妨从低位到高位建Trie
  • 线段树分治往往应用在一些对象知道插入和删除时间时,维护合法情况很容易,但撤销非法情况比较困难时。
  • 要算一个点和一堆点的距离的时候,可以考虑将距离拆成两点深度和-2*lca深度,lca深度可以表示成lca到根的节点数,那么直接树链剖分链上区间加区间求和即可。

图论

  • 求点双连通分量栈中仍然可以存点,圆方树维护起来很方便。
  • 无向图中最大值最小的路径一定在最小生成树上
  • 合并两个连通块的直径,直接比较四个端点两两连起来的长度即可。
  • 一些有代价的完美覆盖问题,选格子有行列限制有代价/收益的题往往考虑网络流。

多项式

  • 碰到诸如(prodlimits_{i=1}^{n}(1+p^ix))的时候,先不急着分治NTT,它既可以多项式ln+exp,又可以倍增。显然倍增更快。

其他

  • 如果遇到(n^3)的转移矩阵,但是我们一次只想知道的结果是一维的(即暴力乘的复杂度是(n^2)),那么可以考虑倍增预处理转移矩阵的幂,求出转移矩阵(2^0,2^1,2^2...)次的结果。询问的时候只需要(n^2log)而不是(n^3log),预处理则是(n^3log),总的复杂度就可以变成(q*n^2log+n^3log)
  • DP时,如果状态很大,结果很小,可以考虑能否将结果与状态互换。
  • 涉及网格图带权,行列选择限制/覆盖一类的问题,可以考虑网络流。
  • 一个经典问题:有一个序列,给出若干个区间,问有多少种选法使得选出的区间能覆盖整个序列。 我们考虑容斥,显然容斥系数是(-1)^强制不覆盖的位置个数,记f[i]为前i个位置都已经确定了,第i个位置不选的方案数和,它可以从(f[j]*(-1)* 2^k)转移而来,我们把所有区间挂在右端点,从左到右扫的时候做区间乘法即可。

 

援引

https://www.cnblogs.com/BAJimH/p/10569411.html

https://blog.csdn.net/JacaJava/article/details/78336840?utm_source=blogxgwz5

以上是关于OI算法竞赛常用套路及优化手段的主要内容,如果未能解决你的问题,请参考以下文章

获奖必备 | 美赛各题目常用算法程序及参考代码汇总

做OI题时的一些常用的常数优化小技巧

竞赛锦囊第二期—数模十大常用算法及说明

备战美赛 | 美赛各题目常用算法程序汇总&参考代码

oi表示啥意思

php常用的优化手段