HDU 4821 String 字符串哈希
Posted jzdwajue
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HDU 4821 String 字符串哈希相关的知识,希望对你有一定的参考价值。
链接:http://acm.hdu.edu.cn/showproblem.php?pid=4821
题意:给出M和L,和一个字符串S。要求找出S的子串中长度为L*M。而且能够分成M段。每段长L,而且M段都不同样的子串个数。
思路:一道字符串哈希题。哈希的方法是BKDRHash。哈希中进制是31,131等素数,(我还以为这是我自己想出来的哈希方法,原来不是,并且进制也不是我选择的26。而是31这种素数。)
从len-1開始哈希,Hash[i]=Hash[i+1]*SEED+(ss[i]-‘a‘+1)。O(n)内计算出整个长串的哈希值。在当中长为L的子串的哈希值是Hash[i]-Hash[j+L]*K[L]。
因为M*L<=10^5。所以在检索过程中复杂度最多是O(M*L)。比赛中想到了一种O(M*L)的写法,只是姿势不够优美,挂掉了。优美的姿势是用unsigned long long 的map映射每段长度L的哈希值,用P.size()记录共出现了多少种不同哈希值。假设P.size()=M。则出现了一种符合题意的子串。
在哈希过程中unsighed long long 范围是0~18446744073709551615,而且会自己主动取模,所以在哈希过程中不须要%MOD这种出现了。
资料:https://www.byvoid.com/blog/string-hash-compare/
代码:
#include<iostream> #include<cstdio> #include<cstring> #include<cmath> #include<map> #include<cstdlib> #include<queue> #include<stack> #include<vector> #include<ctype.h> #include<algorithm> #include<string> #define PI acos(-1.0) #define maxn 10005 #define INF 0x7fffffff #define SEED 31 typedef long long LL; typedef unsigned long long ULL; using namespace std; map < ULL , int > P; ULL Hash[100005]; ULL K[100005]; int main() { int M,L; char ss[100005]; while(scanf("%d%d",&M,&L)!=EOF) { ULL tt=1; scanf("%s",ss); int len=strlen(ss); ULL res=0; Hash[len]=0; K[0]=1; for(int i=1; i<=L; i++) K[i]=K[i-1]*SEED; for(int i=len-1; i>=0; i--) { Hash[i]=Hash[i+1]*SEED+(ss[i]-'a'+1); } int t=0,aa=0; for(int i=0; i<L&&i+M*L<len; i++) { P.clear(); for(int j=i; j<M*L+i; j+=L) { P[Hash[j]-Hash[j+L]*K[L]]++; } if(P.size()==M) aa++; for(int j=M*L+i; j<=len-L; j+=L) { int head= j-M*L; P[Hash[head]-Hash[head+L]*K[L]]--; if(P[Hash[head]-Hash[head+L]*K[L]]==0) P.erase(Hash[head]-Hash[head+L]*K[L]); P[Hash[j]-Hash[j+L]*K[L]]++; if(P.size()==M) aa++; } } printf("%d\n",aa); } return 0; }
以上是关于HDU 4821 String 字符串哈希的主要内容,如果未能解决你的问题,请参考以下文章
hdu 4821 字符串hash+map判重 String (长春市赛区I题)