HashMap解析

Posted 林欣哲

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HashMap解析相关的知识,希望对你有一定的参考价值。

数据结构之哈希表

  • 在哈希表中进行添加,删除,查找等操作,性能十分之高,不考虑哈希冲突的情况下,仅需一次定位即可完成,时间复杂度为O(1)

  • 数据结构的物理存储结构只有两种

    • 顺序存储结构

    • 链式存储结构

  • 哈希表的主干就是数组。对于数组通过指定下标的查找,时间复杂度为O(1)

  • 查找的本质:存储位置 = f(关键字),f是一个哈希函数 

HashMap的结构

  • HashMap的主干是一个Entry数组。

 
   
   
 
  1. transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE;

  • Entry是HashMap中的一个静态内部类,它实现了一个链表结构。链表则是主要为了解决哈希冲突而存在的。

 
   
   
 
  1. static class Entry<K,V> implements Map.Entry<K,V> {

  2.        final K key;

  3.        V value;

  4.        Entry<K,V> next;//存储指向下一个Entry的引用,单链表结构

  5.        int hash;//对key的hashcode值进行hash运算后得到的值,存储在Entry,避免重复计算

  6. ...

  7. }

  • 整体结构如下 

  • 解决的问题:哈希冲突

  • 如果定位到的数组位置不含链表,即当前entry的next指向null,则一次查询即可。

  • 如果定位到的数组包含链表

    • 添加:O(1),直接插入链表头部

    • 查找:O(n),遍历链表,key对象的equals方法逐一比对查找

HashMap的源码分析:插入

 
   
   
 
  1. public V put(K key, V value) {

  2.        //其允许存放null的key和null的value,放在table[0]

  3.        if (key == null)

  4.            return putForNullKey(value);

  5.        int hash = hash(key);

  6.        //得到键的哈希值,用来获取数组中的索引

  7.        int i = indexFor(hash, table.length);

  8.        //如果i处的Entry不为null,则需要在链表中添加,但是添加前需要看是否已存在,存在返回旧值,不存在则最终addEntry。

  9.        for (Entry<K,V> e = table[i]; e != null; e = e.next) {

  10.            Object k;

  11.            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {

  12.                V oldValue = e.value;

  13.                e.value = value;

  14.                e.recordAccess(this);

  15.                return oldValue;

  16.            }

  17.        }

  18.        modCount++;

  19.        addEntry(hash, key, value, i);

  20.        return null;

  21. }

 
   
   
 
  1. void addEntry(int hash, K key, V value, int bucketIndex) {

  2.        //添加前看是否需要扩容

  3.        if ((size >= threshold) && (null != table[bucketIndex])) {

  4.            resize(2 * table.length);

  5.            hash = (null != key) ? hash(key) : 0;

  6.            bucketIndex = indexFor(hash, table.length);

  7.        }

  8.        createEntry(hash, key, value, bucketIndex);

  9. }

  10. void createEntry(int hash, K key, V value, int bucketIndex) {

  11.        // 获取指定 bucketIndex 索引处的 Entry

  12.        Entry<K,V> e = table[bucketIndex];

  13.        // 将新创建的 Entry 放入 bucketIndex 索引处,并让新的 Entry 指向原来的 Entr

  14.        table[bucketIndex] = new Entry<>(hash, key, value, e);

  15.        size++;

  16. }

HashMap的源码分析:读取

 
   
   
 
  1.    public V get(Object key) {

  2.        if (key == null)

  3.            return getForNullKey();

  4.        Entry<K,V> entry = getEntry(key);

  5.        return null == entry ? null : entry.getValue();

  6.    }

  7.    final Entry<K,V> getEntry(Object key) {

  8.        int hash = (key == null) ? 0 : hash(key);

  9.        //通过哈希得到的index的e不为空则继续搜索链表

  10.        for (Entry<K,V> e = table[indexFor(hash, table.length)];

  11.             e != null;

  12.             e = e.next) {

  13.            Object k;

  14.            if (e.hash == hash &&

  15.                ((k = e.key) == key || (key != null && key.equals(k))))

  16.                return e;

  17.        }

  18.        return null;

  19.    }

HashMap的性能参数

  • initialCapacity初始容量

  • transientintsize; 实际存储的key-value键值对的个数

  • intthreshold; 最大容量,threshold一般为 capacity*loadFactory,HashMap在进行扩容时需要参考threshold。初始容量默认为16

  • finalfloatloadFactor; 负载因子,代表了table的填充度有多少,默认是0.75,因此如果负载因子越大,对空间的利用更充分,然而后果是查找效率的降低;如果负载因子太小,那么散列表的数据将过于稀疏,对空间造成严重浪费。

  • transientintmodCount; 用于防止多线程问题的快速失败。由于HashMap非线程安全,在对HashMap进行迭代时,如果期间其他线程的参与导致HashMap的结构发生变化了(比如put,remove等操作),在迭代过程中,判断modCount跟expectedModCount是否相等,如果不相等就表示已经有其他线程修改了Map,则需要抛出异常ConcurrentModificationException

HashMap的扩容

  • HashMap数组的大小需要扩容时,原数组中的数据必须重新计算其在新数组中的位置,并放进去,这就是resize。

  • loadFactor的默认值为0.75。默认情况下,数组大小为16,那么当HashMap中元素个数超过160.75=12的时候,就把数组的大小扩展为 2*16=32,即扩大一倍,然后重新计算每个元素在数组中的位置。

  • 这是一个非常消耗性能的操作,可以预设一个大小。

参考

  1. Java集合学习1:HashMap的实现原理,李大辉,http://tracylihui.github.io/2015/07/01/Java%E9%9B%86%E5%90%88%E5%AD%A6%E4%B9%A01%EF%BC%9AHashMap%E7%9A%84%E5%AE%9E%E7%8E%B0%E5%8E%9F%E7%90%86/

  2. HashMap实现原理及源码分析,dreamcatcher-cx,http://www.cnblogs.com/chengxiao/p/6059914.html




文章预告

1. SpringBoot微服务实战

2. MyCat知识点速查

3. Java IO流 知识点速查


以上是关于HashMap解析的主要内容,如果未能解决你的问题,请参考以下文章

HashMap代码解析

庖丁解牛HashMap源代码解析(多图)

HashMap源代码解析

HashMap核心代码解析

HashMap核心代码解析

HashMap核心代码解析