HashMap理解

Posted llf7

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HashMap理解相关的知识,希望对你有一定的参考价值。

hashCode() 和equals() 方法的重要性体现在什么地方?

Java中的HashMap使用hashCode()和equals()方法设置值,根据键获取值的时候也会用到这两个方法。

  • 怎样设置的值?

    • hashCode()获得 hash值。而hash值用来确定hashmap中内部 Node数组的下标。
    • 之后通过比较hash值与该下标处的key的hash值是不是相等,并使用equals方法比较两个对象是否相同
      • 如果hash和equals 都相等的话,说明两个键是等价的
      • 如果只有hash值相等的话,此时是 hash冲突了,需要用链地址法解决
      • (这里可以引出,如果只修改了equals方法的话而没有修改hash方法,是不行的。两个对象可能equals相等,但是由于没有重写hash方法,有可能导致hash不同。放入元素的key是hash1,取元素的key是hash2,虽然两个key的equals重写之后是相等的,但是key的hash没有重写,所以会取不出来)

    来看源码:

    1 (前导)hash方法调用key的hashCode()方法(如果key的hashCode()方法没有重写的话,就是用的Object的hashCode()方法)

        static final int hash(Object key) {
            int h;
            return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
        }
    

    2 当往HashMap中存入一个值的时候,调用的其实是下面这个方法。预先计算了hash(key)

        public V put(K key, V value) {
            return putVal(hash(key), key, value, false, true);
        }
    

    3 比较 hash(通过hashCode()方法得到)是否相同 和 比较 equals()是否相等。依据情况存入值

       final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                       boolean evict) {
            // 如果数组为空的话,进行初始化
            if ((tab = table) == null || (n = tab.length) == 0)
                n = (tab = resize()).length;
            // 通过 (hash值和数组长度-1) 得到key的下标,
            if ((p = tab[i = (n - 1) & hash]) == null)
                // 如果该下标处的值为空存入元素
                tab[i] = newNode(hash, key, value, null);
            else {
                Node<K,V> e; K k;
                // 通过比较hash值和判断equals是否相等,如果相等覆盖该值
                if (p.hash == hash &&
                    ((k = p.key) == key || (key != null && key.equals(k))))
                    e = p;
                else if (p instanceof TreeNode)
                    ...
                else {
                    // HashMap采用的是链定址法
                    for (int binCount = 0; ; ++binCount) {
                        // 一般情况下,如果链表的下一个是空的话,就插入到下一个中
                        if ((e = p.next) == null) {
                            p.next = newNode(hash, key, value, null);
                            if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                                treeifyBin(tab, hash);
                            break;
                        }
                        // 如果链表中间存在相同的键,就覆盖该值,并跳出循环
                        if (e.hash == hash &&
                            ((k = e.key) == key || (key != null && key.equals(k))))
                            break;
                        p = e;
                    }
                }
    

Java中的HashMap的工作原理是什么?

HashMap采用的是 数组+链定址法 ,HashMap的内部中有一个叫做Node的内部类。HashMap其实就是维护了这个Node内部类数组 Node<K,V>[]。通过hashCode()方法得到hash址,然后通过和 数组长度-1 做位运算 存入数组的下标值。

  • 如果该下标值处的位置没有值,就填入该位置

  • 如果有值了,就比较 hash值是否相同和 equals()是否相等,相等就可以覆盖该值

  • 否则将递归到该处的链表的最末尾(中间有相等的也可以覆盖)

什么是hashmap?

hashmap是一个散列表,存储的内容是 键值对(key-value)映射,

  • HashMap 继承于AbstractMap,实现了Map、Cloneable、java.io.Serializable接口。

hashmap 是线程不安全的,所以它的内部有一个 modCount 变量,表示修改次数。其它线程可能会修改hashmap的结构(删除、增加),而此线程在迭代此时就会抛出 ConcurrentModifiedException。

初始容量大小是16,加载因子是0.75。也就是说在map到达12的时候,会扩容到两倍

    /**
     * Constructs an empty <tt>HashMap</tt> with the default initial capacity
     * (16) and the default load factor (0.75).
     */
    public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
    }

使用的是通过类似于数组下标的方式查找、删除、更新元素等操作,非常高效。但是,当hash的冲突比较多的时候,那么一个数组下标处有多个元素。此时java中的hashmap使用的是链定址法。就是数组+链表。发生hash冲突的时候,就在该下标处的链表末尾添加(如果中间有相等的键,就会覆盖)

如何构造一致性 哈希算法。

???

Object作为HashMap的key的话,对Object有什么要求吗?

要求Object中hashcode不能变。

简单的说就是 Object的equals方法和hashCode方法需要满足一致性要求。而Object的equals方法是比较两个对象的地址,而 hashCode则是 C/C++的原生方法(也是获取内存地址值)。

两者刚好对应,hashcode改变了就可能和equals对应不上。

解释

HashMap中是同时通过 hahsCode() 方法 和 equals() 方法确定 key位置的

而 Object的 equals方法比较的是两个变量的内存地址是否相同

    public boolean equals(Object obj) {
        return (this == obj);
    }

Object 的 hashCode是原生方法

    public native int hashCode();

hashCode方法的一致约定要求
(1)、 在java应用的一次执行过程中,对于同一个对象的hashCode方法的多次调用,他们应该返回同样的值(前提是该对象的信息没有发生变化);
(2)、对于两个对象来说,如果使用equals方法比较返回true,那么这两个对象的hashCode值一定是相同的;
(3) 对于两个对象来说,如果使用equals方法返回false,那么这两个对象的hashCode值不要求一定不同(可以相同,可以不同),但是如果不同则可以提高应用的性能。
(4)、 对于Object类来说,不同Object对象的hashCode值是不同的(Object类的hashcode值表示的是对象的地址)。

hashset 存的数是有序的吗?

hashset 是无序的

为什么HashMap的长度一定是 2 的次幂

通过源码,我们可以发现每次扩容的时候,如果没有超过最大容量的话。每次 newCap都会 << 1 (增加两倍)

        if (oldCap > 0) {
            if (oldCap >= MAXIMUM_CAPACITY) {
                threshold = Integer.MAX_VALUE;
                return oldTab;
            }
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                     oldCap >= DEFAULT_INITIAL_CAPACITY)
                newThr = oldThr << 1; // double threshold
        }

HashMap是通过 hash值 和 数组长度 - 1 的 &运算 得到数组下标的,这样可以很好的将数据分散开。而每次扩容的时候。

而 (n - 1) & hash 这个操作如果在n为2的N次幂的情况下是等同于 hash % n 取余数的值。

        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
         // 计算数组下标 i = 数组长度 & 哈希值
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);

重写equals方法的时候,为什么需要重写hashCode方法

因为,如果不重写hashCode方法。那么在获取对象的hash值的时候,会默认使用Object类的hashCode()方法。

而 HashMap()中需要通过 hashCode() 和 equals 方法 设置键值对 或者 根据键获取值。

只重写了其中的一个的话,无法保证 hashCode方法的一致约定要求

  • 在java应用的一次执行过程中,对于同一个对象的hashCode方法的多次调用,他们应该返回同样的值(前提是该对象的信息没有发生变化);
  • 对于两个对象来说,如果使用equals方法比较返回true,那么这两个对象的hashCode值一定是相同的;
  • 对于两个对象来说,如果使用equals方法返回false,那么这两个对象的hashCode值不要求一定不同(可以相同,可以不同),但是如果不同则可以提高应用的性能。
  • 对于Object类来说,不同Object对象的hashCode值是不同的(Object类的hashcode值表示的是对象的地址)。

参考资料: HashMap实现原理及源码分析

技术图片





以上是关于HashMap理解的主要内容,如果未能解决你的问题,请参考以下文章

HashMap 和 ConcurrentHashMap 的区别

金蝶handler中 collection 代码片段理解

HashMap源码理解

HashTable和HashMap区别理解(很重要)

HashMap深度解析

调用模板化成员函数:帮助我理解另一个 *** 帖子中的代码片段