HashMap 是在 Java 内部使用 LinkedList 还是 Array 实现的?

Posted

技术标签:

【中文标题】HashMap 是在 Java 内部使用 LinkedList 还是 Array 实现的?【英文标题】:Is HashMap internally implemented in Java using LinkedList or Array? 【发布时间】:2013-09-30 06:55:23 【问题描述】:

HashMap 内部是如何实现的?我在某处读到它使用LinkedList,而在其他地方它提到了数组。

我尝试研究HashSet 的代码并找到Entry 数组。那么LinkedList在哪里使用呢?

【问题讨论】:

当您想了解HashMap 的实现时,为什么要看HashSetHashMap 使用链表,但不使用类 LinkedList 阅读源代码?它实际上充满了信息丰富的 cmets... @SotiriosDelimanolis 我只是在浏览所有集合的内部实现,我想学习 hashset 和 hashmap 是可以的 @Grammin:我读了之后很困惑.. @Grammin 我发现文章中没有包含“链接”一词令人惊讶。 (它也有点漫无边际。)面试问题的前提也是微妙的愚蠢。 “你将如何实现哈希表?”是一个很好的面试问题。 “凭记忆解释 Java 如何实现 HashTable”是愚蠢的。虽然当您真正关心微优化时了解这些细节是有价值的,但您没有理由预先记住它们。 【参考方案1】:

基本上是这样的:

 this is the main array
   ↓
[Entry] → Entry → Entry      ← here is the linked-list
[Entry]
[Entry] → Entry
[Entry]
[null ]
[null ]

所以你有一个主数组,其中每个索引对应于某个哈希值(mod'ed* 对应于数组的大小)。

然后它们每个都将指向具有相同哈希值的下一个条目(再次mod'ed*)。这就是链表的用武之地。

*:作为技术说明,it's first hashed with a different function 在被 mod'ed 之前,但作为基本实现,只需修改即可。

【讨论】:

请注意,从java 8开始,如果桶中的LinkedList太大,可以用TreeMap替换。见这里:nurkiewicz.com/2014/04/hashmap-performance-improvements-in.html【参考方案2】:

每个HashMap 都有一个数组,在该数组中,它将每个Entry 放置在根据其键的哈希码(例如int position = entry.getKey().hashCode() % array.length)的位置。存储Entry 的位置称为bucket

如果多个Entry 最终在同一个存储桶中,则这些条目将组合在一个LinkedList 中(另请参阅@Dukeling 的答案)。因此桶隐喻:每个数组索引都是一个“桶”,您可以在其中转储所有匹配的键。

您必须为存储桶使用数组,以实现随机访问所需的恒定时间性能。在存储桶中,您必须遍历所有元素才能找到所需的密钥,因此您可以使用LinkedList,因为它更容易附加(无需调整大小)。

这也表明需要一个好的散列函数,因为如果所有键只散列到几个值,您将得到很长的LinkedLists 来搜索和大量(快速访问)空桶。

【讨论】:

【参考方案3】:

HashMap 有一个 HashMap.Entry 对象数组:

/**
 * The table, resized as necessary. Length MUST Always be a power of two.
 */
transient Entry<K,V>[] table; 

我们可以说Entry是一个单向链表(这样的HashMap.Entry链接被称为“Bucket”)但它实际上并不是一个java.util.LinkedList。

自己看看:

static class Entry<K,V> implements Map.Entry<K,V> 
        final K key;
        V value;
        Entry<K,V> next;
        int hash;

        /**
         * Creates new entry.
         */
        Entry(int h, K k, V v, Entry<K,V> n) 
            value = v;
            next = n;
            key = k;
            hash = h;
        

        public final K getKey() 
            return key;
        

        public final V getValue() 
            return value;
        

        public final V setValue(V newValue) 
            V oldValue = value;
            value = newValue;
            return oldValue;
        

        public final boolean equals(Object o) 
            if (!(o instanceof Map.Entry))
                return false;
            Map.Entry e = (Map.Entry)o;
            Object k1 = getKey();
            Object k2 = e.getKey();
            if (k1 == k2 || (k1 != null && k1.equals(k2))) 
                Object v1 = getValue();
                Object v2 = e.getValue();
                if (v1 == v2 || (v1 != null && v1.equals(v2)))
                    return true;
            
            return false;
        

        public final int hashCode() 
            return (key==null   ? 0 : key.hashCode()) ^
                   (value==null ? 0 : value.hashCode());
        

        public final String toString() 
            return getKey() + "=" + getValue();
        

        /**
         * This method is invoked whenever the value in an entry is
         * overwritten by an invocation of put(k,v) for a key k that's already
         * in the HashMap.
         */
        void recordAccess(HashMap<K,V> m) 
        

        /**
         * This method is invoked whenever the entry is
         * removed from the table.
         */
        void recordRemoval(HashMap<K,V> m) 
        
    

【讨论】:

【参考方案4】:

HashMap 内部使用 Entry 来存储键值对。条目是 LinkedList 类型。

条目包含以下内容 ->

K键,

V值和

Entry next > 即存储桶该位置的下一个条目。

static class Entry<K, V> 
     K key;
     V value;
     Entry<K,V> next;

     public Entry(K key, V value, Entry<K,V> next)
         this.key = key;
         this.value = value;
         this.next = next;
     

HashMap 图-

发件人:http://www.javamadesoeasy.com/2015/02/hashmap-custom-implementation.html

【讨论】:

【参考方案5】:

映射是基于键检索/放置值的东西,因为键与该特定值映射。

但在内部,这种映射技术略有不同。

    这个 HashMap 被定义为一个数组(假设为简单起见,我们的大小为 8)。

    对键进行哈希处理以识别该特定键值对将要存储的数组位置。

    一个。键可以是原始类型或对象

    b.根据key获取hashcode(如果是对象,我们应该在他们的类中实现更好的hashcode和equal方法)

    c。此哈希码使索引和搜索更快。

    d。数学 - 12112,科学 - 23454,泰米尔语 - 3222112,英语 - 3243212

    我们不能将该键值对放入作为哈希码的索引中,因为它大于数组的长度。所以我们做 mod 来获取我们必须放置键值对的数组的位置。 一种。数学将在 12112 % 8 = 0

    b.科学将在 23454 % 8 = 4

    c。泰米尔语将在 3222112 % 8 = 0

    d。英语将在 3243212 % 8 = 6

    如果您仔细观察,我们会在第 0 个索引处发生冲突。我们如何解决这种碰撞?我们必须将两个键值对保存在同一个索引中为此,它们引入了 Node 或 Entry。Node 具有该特定索引的 Key、Value、Hashcode 和下一个节点。

    当我们发生冲突时,它将累加到下一个节点。所以最后会是这样。

    hashMap 只不过是一个链表数组。所以每个位置都有一个数组的链表来避免冲突。

Java 8 之后

由于在链表中搜索的时间复杂度为O(n),因此将这种LinkedList机制改为平衡树。我们必须一一找到LinkedList中的确切元素。在 balance Tree 中,它将是 O(log(n))。

在 Java 8 之后,hashmap 只不过是一个平衡树数组。

【讨论】:

以上是关于HashMap 是在 Java 内部使用 LinkedList 还是 Array 实现的?的主要内容,如果未能解决你的问题,请参考以下文章

从源码的角度来谈一谈HashMap的内部实现原理

Java学习---HashMap和HashSet的内部工作机制

java.util.HashMap 和 HashSet 的内部实现

Java HashMap 内部数据结构在重新散列期间如何变化?

集合-LinkedHashMap 源码解析

Java HashMap实现原理 源码剖析