手写HashMap JDK1.7(无红黑树)

Posted 2023-05-03 蔡徐坤1987

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了手写HashMap JDK1.7(无红黑树)相关的知识，希望对你有一定的参考价值。

public interface MyMap <K,V>

    V get(K k);
    V put(K k, V v);
    int size();
    V remove(K k);
    boolean isEmpty();

package main.java.com.hashmap;

public class MyHashMap <K, V> implements MyMap<K, V>

    final static int DEFAULT_CAPACITY = 16;
    final static float DEFAULT_LOAD_FACTORY = 0.75f;

    private  int capacity;
    private float loadFactor;
    private int size = 0;

    Entry<K,V>[] table;

    public MyHashMap() 
        this(DEFAULT_CAPACITY,DEFAULT_LOAD_FACTORY);
    

    public MyHashMap(int capacity, float loadFactor)
        this.capacity = upperMinPowerOf2(capacity);     //获取为2的幂次方的容量大小
        this.loadFactor = loadFactor;                  //加载因子，用于扩容,本次实现中尚未用到该字段
        this.table = new Entry[capacity];
    

    private int upperMinPowerOf2(int capacity) 
        int power = 1;
        while (power <= capacity)
            power *= 2;
        
        return power;
    

    @Override
    public V get(K k) 
        int index = k.hashCode() % table.length;
        Entry<K, V> current = table[index];
        //遍历链表直至找到相同的hashcode
        while(current != null)
            if(current.k == k)
                return current.v;
            
            current = current.next;
        
        return null;
    

    @Override
    public V put(K k, V v) 
        // 通过k换算hashcode取模绑定数组位置
        int index = k.hashCode() % table.length;
        Entry<K,V> current = table[index];
        //如果index下没有绑定元素，则直接头插法
        if(current == null)
            table[index] = new Entry<K,V>(k,v,null);
            size ++;
            return null;
        
        //如果index下有元素
        if(current != null)
            while(current != null)
                if(current.k == k)
                    V oldValue = current.v;
                    current.v = v;
                    return oldValue;
                
                current = current.next;
                table[index] = new Entry<K,V>(k,v,table[index]);
                size ++;
                return null;
            
        
        return null;
    

    @Override
    public int size() 
        return size;
    

    @Override
    public V remove(K k) 
        int index = k.hashCode() % table.length;
        Entry<K, V> current = table[index];
        V result = null;
        Entry<K,V> pre = null;

        while(current != null)
            if(current.k == k)
                result = current.v;
                size --;
                if(pre!=null)
                    pre.next = current.next;
                else
                    table[index] = current.next;
                
                return result;
            
            //向下遍历
            pre = current;
            current = current.next;
        
        return null;
    

    @Override
    public boolean isEmpty() 
        return size == 0;
    

    class Entry<K, V>
        K k;
        V v;
        Entry<K,V> next;

        public Entry(K k, V v, Entry<K, V> next) 
            this.k = k;
            this.v = v;
            this.next = next;

package main.java.com.hashmap;

public class HashMapTest 

    public static void main(String[] args) 
        MyHashMap<Integer, Integer> hashMap = new MyHashMap<>();
        hashMap.put(1,101);
        hashMap.put(2,202);
        hashMap.put(3,303);
        hashMap.put(1,111);

        int[] keys = new int[]1,2,3;
        for (int i = 0; i < keys.length; i++) 
            System.out.println(keys[i]+"---"+hashMap.get(keys[i]));
        

        hashMap.remove(1);
        hashMap.remove(3);
        System.out.println("hashMap size:"+hashMap.size());
        System.out.println(1+": "+hashMap.get(1));
        System.out.println(3+": "+hashMap.get(3));
        System.out.println(2+": "+hashMap.get(2));

理解：

HashMap在JDK1.8之前是数组+链表的数据结构，比如数组长度是10 （默认长度是1<<4 16）, 在put存储的时候会将key换算成hashcode，并取模length的余数 0~9之间，以便于分散在数组的各个下标中；

而1%10和 11%10 的余数都是1，这种情况下会产生哈希碰撞也叫哈希冲突，1.7中才用单向链表存储这类数据，并使用头插法，查到链表的头部，而其余的元素向下移动一位；

当map中元素过多，且大于数组的75%时，数组会扩容 2的N次幂，此时，比如数组长度由10变成了20，那么取模的范围变成0~19，所有10以上的元素位置发生了变化重新计算位置也就是再哈希，其map在重新计算位置时，查询或者插入的效率会有抖动。

JDK1.8以后，hashmap是数组+链表+红黑树，对查询效率，时间复杂度进行了优化，也就是说在 n>8 时查询效率由n/2 优化为了 olog（n）,之所以还有8位的链表，是因为n<8时，n/2 的效率是大于 olog(n)的

HashMap实现原理（jdk1.7/jdk1.8）

HashMap的底层实现：

1、简单回答

JDK1.7：HashMap的底层实现是：数组+链表
JDK1.8：HashMap的底层实现是：数组+链表/红黑树

为什么要红黑树？
红黑树：一个自平衡的二叉树
当结点多了用红黑树，少了用链表
因为少的话用红黑树太复杂，多了话用红黑树可以提高查询效率。
红黑树：（自动调整根结点，保证左右两边的结点数差不多），它会左旋，右旋来实现。

JDK1.7：HashMap的底层实现是：数组+链表

2、复杂回答v1.0版

每一个对映射关系的存储位置：
存储的位置：
（1）先计算key的hash值，通过hashCode()就可以得到，
（2）再用hash值经过各种（异或）操作，得到一个int数字，目的是使得更均匀的分布在数组的每一个元素中。
（3）再用刚才的int值，与table数组的长度-1做一个“按位与&"
运算，目的是得到一个[i]
   因为数组的长度是2的n次方，长度-1的数的二进制是前面都是0，后面都是1，任何数与它做“&”，结果一定是[0,该数]之间

为什么会出现链表？
(1)两个不同的key对象，仍然可能出现hashCode值一样
(2)就算hashCode不一样，经过刚才的计算，得到[i]是一样的
(3)而我们的数组的元素table[i]本来只能放一个元素，那么现在有多个元素需要存储到table[i]中，只能把这几个元素用链表连接起来

   简单比喻：
   y = f(x)
两个不一样的x，可能得到一样的y

那么存储到HashMap中的是什么样的元素呢？
(1)首先是Map.Entry类型：映射项（键-值对）。
(2)其次HashMap有一个内部类HashMap.Entry实现了Map.Entry接口类型

内部类Entry由四部分组成：
（1）key
（2）value
（3）下一个Entry：next
（4）hash值计算的整数值，为了后面查询快一点

如何避免重复？
如果两个key的hash值是一样的，还要调用一下equlas()方法，如果返回true，就会把新的value替换旧的value。
如果两个key的hash值是一样的，还要调用一下equlas()方法，如果返回false，就会把新的Entry连接到旧的Entry所在链表的头部(first)
如果两个key的hash值是不一样的，但是[i]是一样的，就会把新的Entry连接到旧的Entry所在链表的头部(first)
如果两个key的hash值是不一样的，并且[i]不一样的，肯定存在不同table[i]中

我们把table[i]称为“桶bucket”。

回忆：两个对象的hash值：
（1）如果两个对象是“相等”，他们的hash值一定是一样
   （2）如果两个对象的hash值是一样，他们可能是相同的对象，也可能是不同的对象。

3、复杂追踪源代码v2.0版

(1)什么时候扩容
当元素的个数达到“阈值”，并且新添加的映射关系计算出来的table[i]位置是非空的情况下，再扩容
默认加载因子 (0.75)：DEFAULT_LOAD_FACTOR
阈值 = table.length * 加载因子(loadFactor)
第一次阈值：16 * 0.75 = 12
初始容量：DEFAULT_INITIAL_CAPACITY：16
第二次阈值：32 * 0.75 = 24
...

HashMap中table的长度有一个要求：必须是2的n次方

(2)跟踪一下put方法的源代码
第一步：如果table是空的，会先把table初始化为一个长度为16的数组，如果你指定的长度不是2的n次方，会往上纠正为最接近的2的n次方
          并且把阈值 threshold= table.length * 加载因子(loadFactor) = 12。
第二步：如果key是null，首先确定的位置是table[0]，
     如果原来table[0]已经有key为null的Entry，用新的value替换旧的value
   如果原来table[0]没有key为null的Entry，那么创建一个新的Entry对象，作为table[0]桶下面的链表的头，原来的那些作为它next。

第三步：如果key不是null，那么用key的hashCode值，通过hash()函数算出一个int值称为"hash"
第四步：通过刚才的“hash”的int值与table.length-1做&运算，得到一个下标index，表示新的映射关系即将存入table[index]
第五步：循环判断table[index]位置是否为空，并且是否有Entry的key与我新添加的key是否“相同”，如果相同，就用新的value替换旧的value
第六步：添加新的映射关系
    （1）判断是否要扩容：
        当元素的个数达到“阈值”，并且新添加的映射关系计算出来的table[i]位置是非空的情况下，table再扩容为原来的2倍长
        如果扩容了，那么要重新计算hash和index
    （2）把新的映射关系创建为一个Entry的对象放到table[index]的头部。

JDK1.8:HashMap的底层实现是：数组+链表/红黑树

1、复杂回答v1.0

（1）映射关系的类型
添加到HashMap1.8种的映射关系的对象是HashMap.Node类型，或者是HashMap.TreeNode类型。
它也是Map.Entry接口的实现类。

（2）映射关系添加到table[i]中时，如果里面是链表，新的映射关系是作为原来链表的尾部
“七上八下”：JDK1.7在上，JDK1.8在下。

为什么要在下面，因为如果是红黑树，那么是在叶子上，保持一致，都在下面。

（3）扩容的时机不同
第一种扩容：元素个数size达到阈值threshod = table.length * 加载因子并且table[i]是非空的
第二种扩容：当某个桶table[index]下面的结点的总数原来已经达到了8个，这个时候，要添加第9个时，会检查
table.length是否达到64，如果没达到就扩容。如果添加第10个时，也会检查table.length是否达到64，如果没达到就扩容。
为什么，因为一旦扩容，所有的映射关系要重新计算hash和index，一计算原来table[index]下面可能就没有8个，或新的映射关系也可能不在table[index]，
这样就可能均匀分布。

（4）什么时候从链表变成红黑树
当table[index]下面结点的总数已经达到8个，并且table.length也已经达到64，那么再把映射关系添加到
table[index]下时，就会把原来的链表修改红黑树

（5）什么时候会从红黑树变为链表
当删除映射关系时table[index]下面结点的总数少于6个，会把table[index]下面的红黑树变回链表。

2、put的源代码v2.0

第一步：计算key的hash，用了一个hash()函数，目的得到一个比hashCode更合理分布的一个int值
第二步：如果table是空的，那么把table初始化为长度为16的数组，阈(yu)值初始化为= 默认的长度16 * 默认的加载因子0.75 = 12
DEFAULT_INITIAL_CAPACITY：默认的初始化容量16
DEFAULT_LOAD_FACTOR：默认加载因子 0.75
第三步：查看table[index]是否为空，如果为空，就直接new一个Node放进去
     index = hash的int值 & table.length-1
第四步：先查看table[index]的根节点的key是否与新添加的映射关系的key是否“相同”，如果相同，就用新的value替换原来的value。
   第五步：如果table[index]的根节点的key与新添加的映射关系的key不同，
还要看table[index]根结点的类型是Node还是TreeNode类型，
如果是Node类型，那么就查看链表下的所有节点是否有key与新添加的映射关系的key是否“相同”，如果相同，就用新的value替换原来的value。
如果是TreeNode类型，那么就查看红黑树下的所有叶子节点的key是否与新添加的映射关系的key是否“相同”，如果相同，就用新的value替换原来的value。

第六步：如果没有找到table[index]有结点与新添加的映射关系的key“相同”，那么
如果是TreeNode类型，那么新的映射关系就创建为一个TreeNode，连接到红黑树中
如果是Node类型，那么要查看链表的结点的个数，是否达到8个，如果8个，并且table.length小于64，那么先扩容。
TREEIFY_THRESHOLD：树化阈值8
MIN_TREEIFY_CAPACITY：最小树化容量64

UNTREEIFY_THRESHOLD：反树化，从数变为链表的阈值6

以上是关于手写HashMap JDK1.7(无红黑树)的主要内容，如果未能解决你的问题，请参考以下文章