如何做一个国产数据库 hash一致性算法

Posted qianbo_insist

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何做一个国产数据库 hash一致性算法相关的知识,希望对你有一定的参考价值。

分布式

我们做的是分布式数据库,也就是我们的节点会有很多个。
那么数据应该存储到哪个节点上呢,如何计算?

hash 一致性算法

使用hash一致性算法可以使用多个节点,hash的节点值为ip地址,算法:
unsigned int hvalue = hash(ip);
hash函数计算出一个四字节整型数,按照0----2的32次方排列。那么,就可以计算输入值来放到什么位置了。

unsigned int xxx = hash(输入值);

我们把所有节点放到list里面
#include

list allnode;
算法特别简单,把计算出来的值按照顺时针走,走到哪个节点,就放到哪个节点里面。
为了防止节点出错,冗余算法就是:
1、按照顺时针和逆时针都放入值,这样,在多个节点都有值,假定有n个节点,单个节点出错时,那么取数据出错的概念为0。
2、两个非相邻节点出错时,出错概率依然为0,大大降低了风险。
其他还可以使用校验算法,将多个节点的值进行校验

hash算法

一下为其他hash的算法,为了计算正确,后面的prime为素数。

#include <string.h>
#include <cmath>
#include <thread>
//注意prime是素数
static int rotating_hash(const char *key, int prime)

	size_t hash, i;
	size_t len = strlen(key);
	for (hash = len, i = 0; i < len; i++)
	
		hash = (hash << 4 >> 28) ^ key[i];
		return (hash % prime);
	


static int hash_add(const char* key, int prime)


	size_t hash, i;
	size_t len = strlen(key);
	for (hash = len, i = 0; i < len; i++)
		hash += key[i];
	return (hash % prime);


//求核数后面最大的素数
//只能被自己和1整除的数为素数

static int hash_next_prime(int num) 
	if (num == 1)
		return 2;
	if (num == 2)
		return 3;
	if (num % 2 == 0)
		++num;
	int i;
	bool flag = false;
	while (1)
	
		flag = false;
		for (i = 3; i<num; i += 2)
			if (num % i == 0) 
				flag = true;
				break;
			
		if (!flag)
			return num;
		num += 2;
	

//寻找反向最大的素数
static int find_min_s(int a) 
	int m = 0;
	for (int i = a; i >0; i--) 
		m = 0;
		for (int j = 2; j <= std::sqrt(i); j++) 
			if (i%j == 0) 
				m = 1;
				break;
			

		
		if (m == 0) 
			//std::cout << i << " was the max prime";
			return i;
		
	
	if (m == 0) 
		//std::cout << a << " was the max prime";
		return a;
	

以上为hash一致性的概念和基础,如果您不理解,可以找我聊一聊。后续会继续跟进,下一篇依然写网络,最后再回归到文件系统和算法,待续。。。。。。

以上是关于如何做一个国产数据库 hash一致性算法的主要内容,如果未能解决你的问题,请参考以下文章

一致性Hash算法Java版实现

一致 Hash 算法分析

大白话聊聊面试中常问的一致性 Hash 算法!

用于KV集群的一致性哈希Consistent Hashing机制

一致性hash

一致Hash算法