hash原理

Posted 2022-11-28 xy913741894

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了hash原理相关的知识，希望对你有一定的参考价值。

通过hash函数将数据映射为索引（下标），便于查找，在hash冲突做得好且数据较少的情况下可达到O（1）。

常用的hash函数有除留余数法，线性探测，二次探测，开链法，在大部分情况下基本就是用开链法：

hash的负载因子：元素个数/hash表长度一般控制在0.7 -0. 8

如何提高hash查找的效率

设置好的hash函数，冲突尽量少
空间换时间，增大表长
STL使用素数表
hash桶挂红黑树

hash表扩容

容量扩张（Expand）& 分摊转移

Hash表中每次发现loadFactor到一定程度时（比如大于0.8），就开辟一个原来桶数组的两倍空间（称为新桶数组），然后把原来的桶数组中元素所有转移过来到新的桶数组中。注意这里转移是须要元素一个个又一次哈希到新桶中。

这样的方法的缺点是，容量扩张是一次完毕的，期间要花非常长时间一次转移hash表中的全部元素

Memcached的扩容条件是当表中元素个数超过Hash容量的1.5倍时就进行扩容，扩容过程由独立的线程来完成，扩容过程中会采用2个Hash表，将老表中的数据通过Hash算法映射到新表中，每次移动的桶的数目可以配置，默认是每次移动老表中的1个桶。

这样的策略就把第一个hash表全部元素的转移分摊为多次转移，并且每次转移的期望时间复杂度为O(1)。

参考：深入理解hash

一致性hash，线性hash

以上是关于hash原理的主要内容，如果未能解决你的问题，请参考以下文章