如何做一个国产数据库 hash一致性算法
Posted qianbo_insist
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何做一个国产数据库 hash一致性算法相关的知识,希望对你有一定的参考价值。
分布式
我们做的是分布式数据库,也就是我们的节点会有很多个。
那么数据应该存储到哪个节点上呢,如何计算?
hash 一致性算法
使用hash一致性算法可以使用多个节点,hash的节点值为ip地址,算法:
unsigned int hvalue = hash(ip);
hash函数计算出一个四字节整型数,按照0----2的32次方排列。那么,就可以计算输入值来放到什么位置了。
unsigned int xxx = hash(输入值);
我们把所有节点放到list里面
#include
list allnode;
算法特别简单,把计算出来的值按照顺时针走,走到哪个节点,就放到哪个节点里面。
为了防止节点出错,冗余算法就是:
1、按照顺时针和逆时针都放入值,这样,在多个节点都有值,假定有n个节点,单个节点出错时,那么取数据出错的概念为0。
2、两个非相邻节点出错时,出错概率依然为0,大大降低了风险。
其他还可以使用校验算法,将多个节点的值进行校验
hash算法
一下为其他hash的算法,为了计算正确,后面的prime为素数。
#include <string.h>
#include <cmath>
#include <thread>
//注意prime是素数
static int rotating_hash(const char *key, int prime)
size_t hash, i;
size_t len = strlen(key);
for (hash = len, i = 0; i < len; i++)
hash = (hash << 4 >> 28) ^ key[i];
return (hash % prime);
static int hash_add(const char* key, int prime)
size_t hash, i;
size_t len = strlen(key);
for (hash = len, i = 0; i < len; i++)
hash += key[i];
return (hash % prime);
//求核数后面最大的素数
//只能被自己和1整除的数为素数
static int hash_next_prime(int num)
if (num == 1)
return 2;
if (num == 2)
return 3;
if (num % 2 == 0)
++num;
int i;
bool flag = false;
while (1)
flag = false;
for (i = 3; i<num; i += 2)
if (num % i == 0)
flag = true;
break;
if (!flag)
return num;
num += 2;
//寻找反向最大的素数
static int find_min_s(int a)
int m = 0;
for (int i = a; i >0; i--)
m = 0;
for (int j = 2; j <= std::sqrt(i); j++)
if (i%j == 0)
m = 1;
break;
if (m == 0)
//std::cout << i << " was the max prime";
return i;
if (m == 0)
//std::cout << a << " was the max prime";
return a;
以上为hash一致性的概念和基础,如果您不理解,可以找我聊一聊。后续会继续跟进,下一篇依然写网络,最后再回归到文件系统和算法,待续。。。。。。
以上是关于如何做一个国产数据库 hash一致性算法的主要内容,如果未能解决你的问题,请参考以下文章