集合类源码Collection之Set(HashSet, LinkedHashSet, TreeSet)
Posted lua123
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了集合类源码Collection之Set(HashSet, LinkedHashSet, TreeSet)相关的知识,希望对你有一定的参考价值。
HashSet
先看一下成员变量
// 由此可见内部存储是一个HashMap private transient HashMap<E,Object> map; private static final Object PRESENT = new Object(); public HashSet() { map = new HashMap<>(); }
add方法
public boolean add(E e) { return map.put(e, PRESENT)==null; }
仅仅是把新元素作为key,一个事先初始化好的空Object对象作为value,存入HashMap。
同理,contains方法和remove方法都是调用HashMap的方法
public boolean contains(Object o) { return map.containsKey(o); } public boolean remove(Object o) { return map.remove(o)==PRESENT; }
HashSet实现很简单,完全基于HashMap。
LinkedHashSet
先来看继承关系,继承了HashSet
public class LinkedHashSet<E> extends HashSet<E> implements Set<E>, Cloneable, java.io.Serializable
本身也没有提供相关CRUD方法
来看下构造方法
public LinkedHashSet() { // 调用的父类的方法 super(16, .75f, true); } // 父类(HashSet)构造方法 HashSet(int initialCapacity, float loadFactor, boolean dummy) { // 和HashSet区别在于new了一个LinkedHashMap map = new LinkedHashMap<>(initialCapacity, loadFactor); }
这个构造方法是一个包私有的,仅仅提供给LinkedHashSet使用。
LinkedHashSet的实现基于LinkedHashMap
TreeSet
到这里,不用看也能知道,TreeSet的实现基于TreeMap....
来看成员变量
private transient NavigableMap<E,Object> m; // 人家官方管这个Map中value的默认值叫做“哑值” private static final Object PRESENT = new Object(); public TreeSet() { this(new TreeMap<E,Object>()); } TreeSet(NavigableMap<E,Object> m) { this.m = m; }
而add、contains、remove等方法也不必解释了
public boolean add(E e) { return m.put(e, PRESENT)==null; } public boolean contains(Object o) { return m.containsKey(o); } public boolean remove(Object o) { return m.remove(o)==PRESENT; }
ConcurrentSkipListSet
虽然这个名字很长,人家也是线程安全的Set,但是,依然依托于Map的具体实现类
// 内部存储结构 private final ConcurrentNavigableMap<E,Object> m; // 构造方法 public ConcurrentSkipListSet() { m = new ConcurrentSkipListMap<E,Object>(); } // add public boolean add(E e) { return m.putIfAbsent(e, Boolean.TRUE) == null; } // contains public boolean contains(Object o) { return m.containsKey(o); } // remove public boolean remove(Object o) { return m.remove(o, Boolean.TRUE); }
与前面不同的是,ConcurrentSkipListSet内部Map的value值永远是一个 Boolean.TRUE
优点:
1. 基于跳表实现,查找效率高
2. 线程安全
CopyOnWriteArraySet
这里呢,就不是基于Map的了,毕竟没有 CopyOnWriteArrayMap 这个集合类。虽然没有相关Map实现,但是是不是有一个 CopyOnWriteArrayList ?
private final CopyOnWriteArrayList<E> al; /** * Creates an empty set. */ public CopyOnWriteArraySet() { al = new CopyOnWriteArrayList<E>(); }
那是怎样去重的呢?
public boolean add(E e) { // addIfAbsent:如果没有则添加,就是这样来保证无重复元素的 return al.addIfAbsent(e); }
其它都是直接调用其内部数据结构的方法
public boolean contains(Object o) { return al.contains(o); } public boolean remove(Object o) { return al.remove(o); }
总结:
Set旗下的集合一般都是站在Map集合的肩膀上的,懂了Map,就懂了Set
关于有序和无序:
0. 无序:HashSet
1. 按照自然顺序排序的:TreeSet、ConcurrentSkipListSet
2. 按照添加顺序排序的:LinkedHashSet、CopyOnWriteArraySet
测试程序
public static void main(String[] args) throws Exception { deal(new HashSet<>()); deal(new LinkedHashSet<>()); deal(new TreeSet<>()); deal(new ConcurrentSkipListSet<>()); deal(new CopyOnWriteArraySet<>()); } private static void deal(Set<String> set){ set.add("s1"); set.add("s9"); set.add("s3"); set.add("s5"); set.add("s7"); set.add("s2"); set.add("s8"); System.out.println(set.getClass().getName() + ":" + set); }
结果:
java.util.HashSet:[s3, s5, s7, s8, s9, s1, s2]
java.util.LinkedHashSet:[s1, s9, s3, s5, s7, s2, s8]
java.util.TreeSet:[s1, s2, s3, s5, s7, s8, s9]
java.util.concurrent.ConcurrentSkipListSet:[s1, s2, s3, s5, s7, s8, s9]
java.util.concurrent.CopyOnWriteArraySet:[s1, s9, s3, s5, s7, s2, s8]
以上是关于集合类源码Collection之Set(HashSet, LinkedHashSet, TreeSet)的主要内容,如果未能解决你的问题,请参考以下文章