C++数据结构——哈希表

Posted Y—X

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C++数据结构——哈希表相关的知识,希望对你有一定的参考价值。

1.unordered_map/unordered_set

  1. unordered_map是存储<key, value>键值对的关联式容器,其允许通过keys快速的索引到与其对应的value。
  2. 在unordered_map中,键值通常用于惟一地标识元素,而映射值是一个对象,其内容与此键关联。键和映射值的类型可能不同。
  3. 在内部,unordered_map没有对<kye, value>按照任何特定的顺序排序, 为了能在常数范围内找到key所对应的value,unordered_map将相同哈希值的键值对放在相同的桶中。
  4. unordered_map容器通过key访问单个元素要比map快,但它通常在遍历元素子集的范围迭代方面效率较低。

unordered_map的元素访问:

2. 底层结构

unordered系列的关联式容器之所以效率比较高,是因为其底层使用了哈希结构

2.1哈希概念

哈希结构:可以不经过任何比较,一次直接从表中得到要搜索的元素。通过哈希函数(hashFunc) 使元素的存储位置与它的关键码之间能够建立一一映射的关系,那么在查找时通过该函数可以很快找到该元素。

当向该结构中插入元素:根据待插入元素的关键码,以 函数(hashFunc) 计算出该元素的存储位置并按此位置进行存放。

搜索元素: 对元素的关键码进行同样的计算,把求得的函数值当做元素的存储位置,在结构中按此位置取元素比较,若关键码相等,则搜索成功。

该方式即为哈希(散列)方法,哈希方法中使用的转换函数称为哈希(散列)函数,构造出来的结构称为哈希表(Hash Table)(或者称散列表)

2.3常见哈希函数

1.直接定址法–(常用):

  • 取关键字的某个线性函数为散列地址:Hash(Key)= A*Key + B ;
    优点:简单、高效 ;
    缺点:需要事先知道关键字的分布情况 ;

使用场景:适合查找比较小且连续的情况,比如:第一次出现的字符:构建一个数组hash[ch-‘a’] 来映射位置;
不适用场景:数据分散,数据元素不连续,很容易造成空间浪费,比如 :一组数据最小的为1,最大的到了99999999;

2.除留余数法(常用)

设散列表中允许的地址数为m,取一个不大于m,但最接近或者等于m的质数i作为除数,按照哈希函数:Hash(key) = key% i(p<=m), 将关键码转换成哈希地址;

注意:哈希函数设计的越精妙,产生哈希冲突的可能性就越低,但是无法避免哈希冲突

2.4 哈希冲突

  • 不同关键字通过相同哈希哈数计算出相同的哈希地址,该种现象称为哈希冲突或哈希碰撞

解决哈希冲突两种常见的方法是:闭散列和开散列

3.闭散列(开放定址法)

当发生哈希冲突时,如果哈希表未被装满,说明在哈希表中必然还有空位置,那么可以把key存放到冲突位置中的“下一个” 空位置中去。寻找下一个空位置的方法有线性探测法和二次探测法

3.1线性探测

  • 从发生冲突的位置开始,依次向后探测,直到寻找到下一个空位置为止;

  • 插入:通过哈希函数获取待插入元素在哈希表中的位置

删除:

采用闭散列处理哈希冲突时,不能随便物理删除哈希表中已有的元素,若直接删除元素会影响其他元素的搜索。比如删除元素4,如果直接删除掉,44查找起来可能会受影响。因此线性探测采用标记的伪删除法来删除一个元素;

线性探测的缺点:空间踩踏

3.2闭散列扩容-载荷因子

3.3二次探测



因此:闭散列最大的缺陷就是空间利用率比较低,这也是哈希的缺陷;

4.开散列

开散列法又叫链地址法(开链法),首先对关键码集合用散列函数计算散列地址,具有相同地址的关键码归于同一子集合,每一个子集合称为一个桶,各个桶中的元素通过一个单链表链接起来,各链表的头结点存储在哈希表中。

4.1开散列增容

开散列最好的情况是:每个哈希桶中刚好挂一个节点,再继续插入元素时,每一次都会发生哈希冲突,因此,在元素个数刚好等于桶的个数时,可以给哈希表增容;

  • 载荷因子为1进行扩容;

优点:
- 不同位置冲突时,不再互相干扰,载荷因子一般控制在1

缺点:
- 迭代器遍历输出的时候,不是有序输出的;

如果所有的数据都冲突到一个桶下面了,怎么办?

1.桶下面挂红黑树:极限也是logN的时间复杂度,但是也只是这一会而已,当增容的时候,这种现象就会缓解;
2.多阶哈希

以上是关于C++数据结构——哈希表的主要内容,如果未能解决你的问题,请参考以下文章

C++数据结构——哈希表

C++数据结构——哈希表

C++数据结构——哈希表

C++ 哈希表问题

C++基础语法梳理:数据结构丨哈希表

C++哈希表/散列表