字符串哈希
Posted emcikem
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了字符串哈希相关的知识,希望对你有一定的参考价值。
hash_map 底层是hash表,查询时间复杂度是O(1)
map 底层是红黑树,查询时间复杂度是O(logn)
字符hash模板
进制哈希
首先设一个进制数base,并设一个模数mod
而哈希其实就是把一个数转化为一个值,这个值是base进制的,储存在哈希表中,注意一下在存入的时候取模一下即可
hash相当于加密设置,把一个字符串进行加密,得到一个数值
hash冲突
但是hash是存在hash冲突的
就比如所orzc的哈希值是233,而orzhjw的哈希值也是233
那么我们在查询的时候代码会认为这两个字符串是相同的,但显然这两个字符串是不同的
减少hash冲突
自然溢出法
双哈希法
单哈希法
无错哈希
多重哈希
自然溢出
#include <iostream>
#include <cstdio>
#include <algorithm>
#include <cstring>
#define ull unsigned long long
using namespace std;
ull base=131;
ull a[10010];
ull hashs(char s[])
int len=strlen(s);
ull ans=0;
for(int i=0;i<len;i++)
ans=ans*base+(ull)s[i];
return ans&0x7fffffff;//除以无穷大,自然溢出
int main()
int n;
scanf("%d",&n);
for(int i=1;i<=n;i++)
char str[10010];
scanf("%s",str);
a[i]=hashs(str);
sort(a+1,a+1+n);
int cnt=1;
for(int i=2;i<=n;i++)
if(a[i]!=a[i-1])cnt++;
printf("%d\n",cnt);
return 0;
单哈希
就是加一个取模运算,mod进行取模,只进行一次hashs运算
双哈希
进行两次hashs运算
两次hash进行比较
//因为有时候两个字符串不同,但hash相同,则只要保证两种hash有一个不同的话,那么两个字符串就肯定不同
#include <iostream>
#include <cstdio>
#include <algorithm>
#include <cstring>
#define ull unsigned long long
using namespace std;
struct data
ull x,y;
a[10010];
ull base=131;
ull mod1=19260817;
ull mod2=19260813;//随便定义两个不同的大数
ull hash1(char s[])
int len=strlen(s);
ull ans=0;
for(int i=0;i<len;i++)
ans=(ans*base+(ull)s[i])%mod1;
return ans;
ull hash2(char s[])
int len=strlen(s);
ull ans=0;
for(int i=0;i<len;i++)
ans=(ans*base+(ull)s[i])%mod2;
return ans;
bool cmp(data a,data b)
if(a.x==b.y)return a.y<b.y;
return a.x<b.x;
int main()
int n;
cin>>n;
for(int i=1;i<=n;i++)
char str[10010];
scanf("%s",str);
a[i].x=hash1(str);
a[i].y=hash2(str);
sort(a+1,a+1+n,cmp);
int cnt=1;
for(int i=2;i<=n;i++)
if(a[i].x!=a[i-1].x||a[i].y!=a[i-1].y)cnt++;//只要有一个不同即可
printf("%d\n",cnt);
return 0;
以上是关于字符串哈希的主要内容,如果未能解决你的问题,请参考以下文章