如何做一个国产数据库 hash一致性算法

Posted 2022-03-29 qianbo_insist

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了如何做一个国产数据库 hash一致性算法相关的知识，希望对你有一定的参考价值。

分布式

我们做的是分布式数据库，也就是我们的节点会有很多个。
那么数据应该存储到哪个节点上呢，如何计算？

hash 一致性算法

使用hash一致性算法可以使用多个节点，hash的节点值为ip地址，算法：
unsigned int hvalue = hash(ip);
hash函数计算出一个四字节整型数，按照0----2的32次方排列。那么，就可以计算输入值来放到什么位置了。

unsigned int xxx = hash(输入值)；

我们把所有节点放到list里面
#include

list allnode;
算法特别简单，把计算出来的值按照顺时针走，走到哪个节点，就放到哪个节点里面。
为了防止节点出错，冗余算法就是：
1、按照顺时针和逆时针都放入值，这样，在多个节点都有值，假定有n个节点，单个节点出错时，那么取数据出错的概念为0。
2、两个非相邻节点出错时，出错概率依然为0，大大降低了风险。
其他还可以使用校验算法，将多个节点的值进行校验

hash算法

一下为其他hash的算法，为了计算正确，后面的prime为素数。

#include <string.h>
#include <cmath>
#include <thread>
//注意prime是素数
static int rotating_hash(const char *key, int prime)

	size_t hash, i;
	size_t len = strlen(key);
	for (hash = len, i = 0; i < len; i++)
	
		hash = (hash << 4 >> 28) ^ key[i];
		return (hash % prime);
	


static int hash_add(const char* key, int prime)


	size_t hash, i;
	size_t len = strlen(key);
	for (hash = len, i = 0; i < len; i++)
		hash += key[i];
	return (hash % prime);


//求核数后面最大的素数
//只能被自己和1整除的数为素数

static int hash_next_prime(int num) 
	if (num == 1)
		return 2;
	if (num == 2)
		return 3;
	if (num % 2 == 0)
		++num;
	int i;
	bool flag = false;
	while (1)
	
		flag = false;
		for (i = 3; i<num; i += 2)
			if (num % i == 0) 
				flag = true;
				break;
			
		if (!flag)
			return num;
		num += 2;
	

//寻找反向最大的素数
static int find_min_s(int a) 
	int m = 0;
	for (int i = a; i >0; i--) 
		m = 0;
		for (int j = 2; j <= std::sqrt(i); j++) 
			if (i%j == 0) 
				m = 1;
				break;
			

		
		if (m == 0) 
			//std::cout << i << " was the max prime";
			return i;
		
	
	if (m == 0) 
		//std::cout << a << " was the max prime";
		return a;

以上为hash一致性的概念和基础，如果您不理解，可以找我聊一聊。后续会继续跟进，下一篇依然写网络，最后再回归到文件系统和算法，待续。。。。。。

以上是关于如何做一个国产数据库 hash一致性算法的主要内容，如果未能解决你的问题，请参考以下文章