java集合Set集合之HashSet详解

Posted 2020-11-23 yuexiaoyun

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了java集合Set集合之HashSet详解相关的知识，希望对你有一定的参考价值。

技术图片

①：实现了Serializable接口，表明它支持序列化。
②：实现了Cloneable接口，表明它支持克隆，可以调用超类的clone（）方法进行浅拷贝。
③继承了AbstractSet抽象类，和ArrayList和LinkedList一样，在他们的抽象父类中，都提供了equals（）方法和hashCode（）方法。它们自身并不实现这两个方法，（但是ArrayList和LinkedList的equals（）实现不同。你可以看我的关于ArrayList这一块的源码解析）这就意味着诸如和HashSet一样继承自AbstractSet抽象类的TreeSet、LinkedHashSet等，他们只要元素的个数和集合中元素相同，即使他们是AbstractSet不同的子类，他们equals（）相互比较的后的结果仍然是true。下面给出的代码是JDK中的equals（）代码：
从JDK源码可以看出，底层并没有使用我们常规认为的利用hashcode（）方法求的值进行比较，而是通过调用AbstractCollection的containsAll（）方法，如果他们中元素完全相同（与顺序无关），则他们的equals（）方法的比较结果就为true。

    public boolean equals(Object o) {
        if (o == this)
            return true;
        if (!(o instanceof Set))
            return false;
        Collection<?> c = (Collection<?>) o;
        //必须保证元素的个数相等。
        if (c.size() != size())
            return false;
        try {
        //调用了AbstractCollection的方法。
            return containsAll(c);
        } catch (ClassCastException unused)   {
            return false;
        } catch (NullPointerException unused) {
            return false;
        }
    }

    public boolean containsAll(Collection<?> c) {
    //只需要逐个判断集合是否包含其中的元素。
        for (Object e : c)
            if (!contains(e))
                return false;
        return true;
    }

④实现了Set接口。

老规矩还是先把总结放到上面：
①HashSet内部通过使用HashMap的键来存储集合中的元素，而且内部的HashMap的所有值
都是null。（因为在为HashSet添加元素的时候，内部HashMap的值都是PRESENT），而PRESENT在实例域的地方直接初始化了，而且不允许改变。
②HashSet对外提供的所有方法内部都是通过HashMap操作完成的，所以，要真正理解HashSet的实现，只需要把HashMap的原理理解即可。我也对HashMap做了分析。传送门：
③所以，如果你对HashMap很熟悉的话，学习HastSet的源码轻而易举！

1：首先我们先看看HashSet的有哪些实例域:（是不是少了很多，而且还简单(⊙o⊙)…）

    //序列化ID
    static final long serialVersionUID = -5024744406713321676L;
    //底层使用了HashMap存储数据。
    private transient HashMap<E,Object> map;
    //用来填充底层数据结构HashMap中的value，因为HashSet只用key存储数据。
    private static final Object PRESENT = new Object();

2：老规矩，还是先看一下它们的构造方法：
构造器的实现基本都是使用HashMap

//其实只是实例化了HashMap (⊙o⊙)…（不懂的童鞋，可以看我的另一篇关于HashMap的源码解析）
    public HashSet() {
        map = new HashMap<>();
    }

//还是关于
    public HashSet(Collection<? extends E> c) {
        map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
        addAll(c);
    }
    //调用的AbstractCollection中的方法。然后调用HashSet的add（）方法把集合中的
    //所有元素添加到了集合中。（因为）
    public boolean addAll(Collection<? extends E> c) {
        boolean modified = false;
        for (E e : c)
            if (add(e))
                modified = true;
        return modified;
    }
    //底层并不支持直接在AbstractCollection类中调用add（）方法，而是调用add（）方法
    //的自身实现。
public boolean add(E e) {
        throw new UnsupportedOperationException();
    }

//初始化HashSet仍然是关于HashMap的知识。
    public HashSet(int initialCapacity) {
        map = new HashMap<>(initialCapacity);
    }

//初始化HashSet仍然是关于HashMap的知识。
    public HashSet(int initialCapacity, float loadFactor) {
        map = new HashMap<>(initialCapacity, loadFactor);
    }

//这次初始化底层使用了LinkedHashMap实现。
    HashSet(int initialCapacity, float loadFactor, boolean dummy) {
        map = new LinkedHashMap<>(initialCapacity, loadFactor);
    }

3：添加新的元素：

//底层仍然利用了HashMap键进行了元素的添加。
//在HashMap的put()方法中，该方法的返回值是对应HashMap中键值对中的值，而值总是PRESENT,
//该PRESENT一直都是private static final Object PRESENT = new Object();
//PRESENT只是初始化了，并不能改变，所以PRESENT的值一直为null。
//所以只要插入成功了，put（）方法返回的值总是null。
    public boolean add(E e) {
        return map.put(e, PRESENT)==null;
    }

4：删除一个元素：

//该方法底层实现了仍然使用了map的remove（）方法。
//map的remove（）方法的返回的是被删除键对应的值。（在HashSet的底层HashMap中的所有
//键值对的值都是PRESENT）
    public boolean remove(Object o) {
        return map.remove(o)==PRESENT;
    }

5：清空方法

    public void clear() {
        map.clear();
    }

6：克隆方法（浅克隆）
底层仍然使用了Object的clone（）方法，得到的Object对象，并把它强制转化为HashSet<E>,然后把它的底层的HashMap也克隆一份（调用的HashMap的clone（）方法），并把它赋值给newSet，最后返回newSet即可。

    @SuppressWarnings("unchecked")
    public Object clone() {
        try {
            HashSet<E> newSet = (HashSet<E>) super.clone();
            newSet.map = (HashMap<E, Object>) map.clone();
            return newSet;
        } catch (CloneNotSupportedException e) {
            throw new InternalError(e);
        }
    }

7：是否包含某个元素

底层仍然使用了HashMap的containsKey（）方法（因为HashSet只用到了HashMap的键）同样的话重复了好多遍 ……….(艹皿艹 )

    public boolean contains(Object o) {
        return map.containsKey(o);
    }

8：判断是否为空
仍然调用HashMap的方法。

    public boolean isEmpty() {
        return map.isEmpty();
    }

9：生成一个迭代器

仍然使用了HashMap的键的迭代器

    public Iterator<E> iterator() {
        return map.keySet().iterator();
    }

10：统计HashSet中包含元素的个数

还是调用HashMap的实现。

    public int size() {
        return map.size();
    }

11：把HashSet写入流中（也就是序列化）
在HashSet序列化实现中，仍然是把HashMap中的属性写入流中。（因为HashSet中真正存储数据的数据结构是HashMap。）

    private void writeObject(java.io.ObjectOutputStream s)
        throws java.io.IOException {
        // Write out any hidden serialization magic
        s.defaultWriteObject();

        // Write out HashMap capacity and load factor
        //把HashMap的容量写入流中。
        s.writeInt(map.capacity());
        //把HashMap的装载因子写入流中。
        s.writeFloat(map.loadFactor());
        //把HashMap中键值对的个数写入流中。
        s.writeInt(map.size());

        // 按正确的顺序把集合中的所有元素写入流中。
        for (E e : map.keySet())
            s.writeObject(e);
    }

12：从流中读取数据，组装HashSet（反序列化）

private void readObject(java.io.ObjectInputStream s)
        throws java.io.IOException, ClassNotFoundException {
        // Read in any hidden serialization magic
        s.defaultReadObject();

        // Read capacity and verify non-negative.
        int capacity = s.readInt();
        if (capacity < 0) {
            throw new InvalidObjectException("Illegal capacity: " +
                                             capacity);
        }

        // Read load factor and verify positive and non NaN.
        float loadFactor = s.readFloat();
        if (loadFactor <= 0 || Float.isNaN(loadFactor)) {
            throw new InvalidObjectException("Illegal load factor: " +
                                             loadFactor);
        }

        // Read size and verify non-negative.
        int size = s.readInt();
        if (size < 0) {
            throw new InvalidObjectException("Illegal size: " +
                                             size);
        }
        // Set the capacity according to the size and load factor ensuring that
        // the HashMap is at least 25% full but clamping to maximum capacity.
        capacity = (int) Math.min(size * Math.min(1 / loadFactor, 4.0f),
                HashMap.MAXIMUM_CAPACITY);

        //HashMap中构建哈希桶数组是在第一个元素被添加的时候才构建，所以在构建之前检查它,
        // 调用HashMap.tableSizeFor来计算实际分配的大小,
        // 检查Map.Entry []类，因为它是最接近的公共类型实际创建的内容。

        SharedSecrets.getJavaOISAccess()
                         .checkArray(s, Map.Entry[].class,HashMap.tableSizeFor(capacity));

        //创建HashMap。
        map = (((HashSet<?>)this) instanceof LinkedHashSet ?
               new LinkedHashMap<E,Object>(capacity, loadFactor) :
               new HashMap<E,Object>(capacity, loadFactor));

        // 按写入流中的顺序再把元素依次读取出来放到map中。
        for (int i=0; i<size; i++) {
            @SuppressWarnings("unchecked")
                E e = (E) s.readObject();
            map.put(e, PRESENT);
        }
    }

以上是关于java集合Set集合之HashSet详解的主要内容，如果未能解决你的问题，请参考以下文章

java集合Set集合之EnumSet详解

Java集合进阶之Collection单列集合（Set）

Java集合详解7：HashSet，TreeSet与LinkedHashSet

Java集合Collection 体系集合详解（ArrayList，LinkedList，HashSet，TreeSet...）

java集合之HashSet哈希SET基础

集合详解之HashMap