快速了解Hash算法

Posted linyufeng

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了快速了解Hash算法相关的知识,希望对你有一定的参考价值。

 

 

1.hash

Hash,一般翻译做“散列”,也有直接音译为“哈希”的,就是把任意长度的输入(又叫做预映射pre-image)通过散列算法变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,所以不可能从散列值来确定唯一的输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。 -- 来自百度百科

大白话: 任意输入值都有一个固定长度的输出

2.hash算法

hash算法很多,下面是Java中,字符串计算hashcode的源码:

public int hashCode() {
    int h = hash;
    if (h == 0 && value.length > 0) {
        char val[] = value;
        for (int i = 0; i < value.length; i++) {
            h = 31 * h + val[i];
        }
        hash = h;
    }
    return h;
}

很多人会疑惑为什么会是31?

  1. 31时是质数(只能分解成1和自身)可以增加结果的唯一性,因为函数算法(也叫散列函数)要尽可能的平均分布
  2. 虚拟机可以优化计算速度.

当然,也可以不使用31用其他值代替...,单元测试模拟一下

@Test
public void test01(){
  String s = "Hello";
  System.out.println(s.hashCode());
  
  int code = (int)‘H‘;
  code = 31*code + (int)‘e‘;
  code = 31*code + (int)‘l‘;
  code = 31*code + (int)‘l‘;
  code = 31*code + (int)‘o‘;
  System.out.println(code);
}

 

技术分享图片
 

 

参考资料

以上是关于快速了解Hash算法的主要内容,如果未能解决你的问题,请参考以下文章

深入了解一下一致性Hash算法

hash算法

HASH算法

好程序员带你五分钟了解一致性hash算法

分布式必须要了解下Consistent-Hash(一致性哈希算法)

有人可以解释啥是 SVN 平分算法吗?理论上和通过代码片段[重复]