128 哈希函数

Posted 唐的糖

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了128 哈希函数相关的知识,希望对你有一定的参考价值。

原题网址:https://www.lintcode.com/problem/hash-function/description

描述

在数据结构中,哈希函数是用来将一个字符串(或任何其他类型)转化为小于哈希表大小且大于等于零的整数。一个好的哈希函数可以尽可能少地产生冲突。一种广泛使用的哈希函数算法是使用数值33,假设任何字符串都是基于33的一个大整数,比如:

hashcode("abcd") = (ascii(a) * 333 + ascii(b) * 332 + ascii(c) *33 + ascii(d)) % HASH_SIZE 

                              = (97* 333 + 98 * 332 + 99 * 33 +100) % HASH_SIZE

                              = 3595978 % HASH_SIZE

其中HASH_SIZE表示哈希表的大小(可以假设一个哈希表就是一个索引0 ~ HASH_SIZE-1的数组)。

给出一个字符串作为key和一个哈希表的大小,返回这个字符串的哈希值。

您在真实的面试中是否遇到过这个题?  

说明

For this problem, you are not necessary to design your own hash algorithm or consider any collision issue, you just need to implement the algorithm as described.

样例

对于key="abcd" 并且 size=100, 返回 78

标签
哈希表

 

思路:哈希函数的实现算法题目已经给出了,照着实现就好。这题考察的是类似大数阶乘的数据溢出问题,如果直接将字符串转成整数再求余,emmm……一般会溢出。所以在将字符串逐个字符转成整数的过程中就应该取余防止数据过大。

对于整数求模,(a * b) % m = a % m * b % m这个基本公式务必牢记。根据这个公式我们可以大大降低时间复杂度和规避溢出。 转载自此处

具体实现方式可以从高位(权值大的)到低位(权值小的)依次转化,也可以从低位到高位依次转化,后者需要额外定义一个权值,每次循环时*33,权值也同样需要取余。

AC代码(高位到低位):

这种很好理解,result 是 HASH_SIZE 整数倍的那部分随着循环继续再乘以33(的幂)一定还是HASH_SIZE的整数倍,所以可以用求余运算剪掉这部分。

class Solution {
public:
    /**
     * @param key: A string you should hash
     * @param HASH_SIZE: An integer
     * @return: An integer
     */
    int hashCode(string &key, int HASH_SIZE) {
        // write your code here
     int n=key.size();
     if (n==0)
     {
         return 0;
     }
     long result=key[0];//注意数据类型是long,防止数据过大造成溢出;
     for (int i=1;i<n;i++)
     {
         result=result*33+key[i];
         result=result%HASH_SIZE;//及时求余防溢出;
     }
     return result;
    }
};

低位到高位代码:

这种我的理解是,hashBase 同理上面的推理。至于result,其值一直在增大,超出HASH_SIZE整数倍的部分就可以舍弃。

 int hashCode(string &key, int HASH_SIZE)
 {
     int n=key.size();
     if (n==0)
     {
         return 0;
     }
     long result=0;//注意数据类型;
     long hashBase=1;//权值,注意数据类型;
     for (int i=n-1;i>=0;i--)
     {
         result=result+key[i]*hashBase;
         result=result%HASH_SIZE;//及时求余防溢出;
         hashBase=hashBase*33%HASH_SIZE;//及时求余防溢出;
     }
     return result;
 }

 

参考:https://blog.csdn.net/nawuyao/article/details/50953557

https://www.cnblogs.com/libaoquan/p/7217165.html

https://www.jianshu.com/p/9a67268b5a94

https://blog.csdn.net/outmain/article/details/51233385

https://blog.csdn.net/ljlstart/article/details/48391799

 

 

 

以上是关于128 哈希函数的主要内容,如果未能解决你的问题,请参考以下文章

HashMap原理:哈希函数的设计

SHA512 算法的哈希值是 128 位长吗?

在 PHP 中匹配 128 个字符的密码哈希 - 使用 Ruby on Rails 加密

散列 torrent 文件片段

哈希加密算法

哈希函数的常用构造方法