Java中HashMap集合及get()和put()的实现原理

Posted 2021-09-08 g0rez

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Java中HashMap集合及get()和put()的实现原理相关的知识，希望对你有一定的参考价值。

HashMap集合：

1、HashMap集合基础

底层是哈希表/散列表的数据结构，是非线程安全的。在JDK8之后，如果哈希表单向链表中元素超过8个，单向链表这种数据结构会变成红黑树数据结构。当红黑树上的节点数量小于6时，会重新把红黑树变成单向链表数据结构。这种方式也是为了提高检索效率，二叉树的检索会再次缩小扫描范围。提高效率。初始化容量16.默认加载因子0.75扩容是：扩容之后的容量是原容量的2倍。HashMap集合的key和value允许null，但只能有一个key为null，再次put加入时会覆盖。

2、哈希表是一个怎样的数据结构呢？

哈希表是一个数组和单向链表的结合体。
数组：在查询方面效率很高，随机增删方面效率很低。
单向链表：在随机增删方面效率较高，在查询方面效率很低。
哈希表将以上的两种数据结构融合在一起，充分发挥它们各自的优点。

3、HashMap集合底层的源代码：

public class HashMap{
            // HashMap底层实际上就是一个数组。(一维数组)
            Node<K,V>[] table;
            // 静态的内部类HashMap.Node
            static class Node<K,V> {
                final int hash; // 哈希值(哈希值是key的hashCode()方法的执行结果。hash值通过哈希函数/算法，可以转换存储成数组的下标。)
                final K key; // 存储到Map集合中的那个key
                V value; // 存储到Map集合中的那个value
                Node<K,V> next; // 下一个节点的内存地址。
            }
        }

哈希表/散列表：一维数组，这个数组中每一个元素是一个单向链表。(数组和链表的结合体。)

4、最主要掌握的是：

map.put(k,v)
v = map.get(k)
以上这两个方法的实现原理，是必须掌握的。

put(k,v)实现原理：

第一步:先将k v封装到Node对象当中。
第二步:底层会调用k的hashCode0方法得出hash值，然后通过哈希函数/哈希算法，将hash值转换成数组的下标，下标位置上如果没有任何元素，就把Node添加到这个位置上了。如果说下标对应的位置上有链表,此时会拿着k和链表上每一个节点中的k进行equals ,如果所有的equals方法返回都是false，那么这个新节点将会被添加到链表的末尾。如果其中有一个equals返回了true,那么这个节点的value将会被覆盖。

get(k)实现原理：

先调用k的hashCode()方法得出哈希值，通过哈希算法转换成数组下标,通过数组下标快速定位到某个位置上,如果这个位置上什么也没有,返回null。如果这个位置上有单向链表，那么会拿着参数k和单向链表上的每个节点中的k进行equals,如果所有equals方法返回false,那么get方法返回null,只要其中有一个节点的k和参数k equals的时候返回true，那么此时这个节点的value就是我们要找的value , get方法最终返回这个要找的value.

小结：为什么哈希表的随机增删，以及查询效率都很高?

答：增删是在链表上完成。查询也不需要都扫描,只需要部分扫描。

5、HashMap集合的key部分特点：

无序，不可重复。
为什么无序？因为不一定挂到哪个单向链表上。
不可重复是怎么保证的？ equals方法来保证HashMap集合的key不可重复。
如果key重复了，value会覆盖。
放在HashMap集合key部分的元素其实就是放到HashSet集合中了。
所以HashSet集合中的元素也需要同时重写hashCode()+equals()方法。

6、哈希表HashMap使用不当时无法发挥性能！

假设将所有的hashCode()方法返回值固定为某个值，那么会导致底层哈希表变成了
纯单向链表。这种情况我们成为：散列分布不均匀。
什么是散列分布均匀？
假设有100个元素，10个单向链表，那么每个单向链表上有10个节点，这是最
好的，是散列分布均匀的。
假设将所有的hashCode()方法返回值都设定为不一样的值，可以吗，有什么问题？
不行，因为这样的话导致底层哈希表就成为一维数组了，没有链表的概念了。
也是散列分布不均匀。
散列分布均匀需要你重写hashCode()方法时有一定的技巧。

7、重点：放在HashMap集合key部分的元素，以及放在HashSet集合中的元素，需要同时重写hashCode和equals方法。

8、HashMap集合的默认初始化容量是16，默认加载因子是0.75

这个默认加载因子是当HashMap集合底层数组的容量达到75%的时候，数组开始扩容。
重点，记住：HashMap集合初始化容量必须是2的次幂，这也是官方推荐的，
这是因为达到散列均匀，为了提高HashMap集合的存取效率，所必须的。

9、向Map集合中存，以及从Map集合中取，都是先调用key的hashCode方法，然后再调用equals方法！

equals方法有可能调用，也有可能不调用。
拿put(k,v)举例，什么时候equals不会调用？
k.hashCode()方法返回哈希值，
哈希值经过哈希算法转换成数组下标。
数组下标位置上如果是null，equals不需要执行。
拿get(k)举例，什么时候equals不会调用？
k.hashCode()方法返回哈希值，
哈希值经过哈希算法转换成数组下标。
数组下标位置上如果是null，equals不需要执行。

10、注意：如果一个类的equals方法重写了，那么hashCode()方法必须重写。

并且equals方法返回如果是true，hashCode()方法返回的值必须一样。
equals方法返回true表示两个对象相同，在同一个单向链表上比较。
那么对于同一个单向链表上的节点来说，他们的哈希值都是相同的。
所以hashCode()方法的返回值也应该相同。

11、hashCode()方法和equals()方法不用研究了，直接使用IDEA工具生成，但是这两个方法需要同时生成。

12、终极结论：

放在HashMap集合key部分的，以及放在HashSet集合中的元素，需要同时重写hashCode方法和equals方法。

13、对于哈希表数据结构来说：

如果o1和o2的hash值相同，一定是放到同一个单向链表上。
当然如果o1和o2的hash值不同，但由于哈希算法执行结束之后转换的数组下标可能相同，此时会发生“哈希碰撞”。
结论：对于HashMap在同一个链表上的hash值可能相同也可能不同，在不考虑“哈希碰撞”的情况下，hash值是相同的。
如果hash值不相同但经过哈希算法转换成的数组下标相同的话也会在同一个链表上。

by-动力节点学习笔记整理

以上是关于Java中HashMap集合及get()和put()的实现原理的主要内容，如果未能解决你的问题，请参考以下文章