源码阅读(27):Java中主要的Set结构——LinkedHashSetTreeSet等结构

Posted 说好不能打脸

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了源码阅读(27):Java中主要的Set结构——LinkedHashSetTreeSet等结构相关的知识,希望对你有一定的参考价值。

(接上文《源码阅读(26):Java中主要的Set结构——HashSet》)

1、概述

和HashSet类似,Java中另外两个主要的Set集合结构也做了这样依赖结构,既是LinkedHashSet集合继承了HashSet,并实际应用HashSet集合中构造函数,完成实例化;TreeSet集合内部结构依赖于TreeMap集合,也就是说TreeSet内部数据结构同样是红黑树。

2、LinkedHashSet集合

LinkedHashSet集合的主要继承体系的示意图已经在上文中给出,这里就不再进行赘述了。LinkedHashSet集合的代码非常简单基本上可以说是java集合框架中(Java Collections Framework )代码最简单的几个类之一——整个类加注释一共不到200行。它之所以那么简单是因为它的功能全部依靠LinkedHashMap容器进行工作,且没有提供除此之外额外的特殊功能。

2.1、LinkedHashSet集合的构造函数

首先我们介绍LinkedHashSet集合的构造函数,相关代码片段如下所示

public class LinkedHashSet<E>
    extends HashSet<E>
    implements Set<E>, Cloneable, java.io.Serializable 
  // ......
  
  // 可以看到LinkedHashSet集合中所有的构造函数都调用了父类HashSet中
  // HashSet(int initialCapacity, float loadFactor, boolean dummy) 
  // 这个构造函数,这个构造函数也涉及到我们上文中的一个未解决的疑问。
  public LinkedHashSet(int initialCapacity, float loadFactor) 
    super(initialCapacity, loadFactor, true);
  
  
  // 这些构造函数的作用都不在赘述,initialCapacity代表初始化容量
  // loadFactor代表负载因子
  public LinkedHashSet(int initialCapacity) 
    super(initialCapacity, .75f, true);
  
  
  // 初始化容量16,负载因子0.75
  public LinkedHashSet() 
    super(16, .75f, true);
  

  public LinkedHashSet(Collection<? extends E> c) 
    // 将LinkedHashSet集合的初始化容量设定为当前参照集合“c”的大小的两倍
    // 如果前者小于11,那么设定初始化容量为11
    super(Math.max(2*c.size(), 11), .75f, true);
    addAll(c);
  
  
  // ......

从以上构造函数的代码片段我们可以知道,要了解LinkedHashSet集合的各种构造函数,只需要了解其父类HashSet中的HashSet(int initialCapacity, float loadFactor, boolean dummy)构造函数,为了便于介绍,我们这里再给出相关代码片段:

public class HashSet<E>
  extends AbstractSet<E>
  implements Set<E>, Cloneable, java.io.Serializable 
  
  // ......
  HashSet(int initialCapacity, float loadFactor, boolean dummy) 
    map = new LinkedHashMap<>(initialCapacity, loadFactor);
  
  // ......

  • 该构造函数一共有三个参数,最后一个参数“dummy”中文含义是“虚假的”,而且从代码中我们也可以看出这个参数实际上并没有被使用。这是因为在HashSet集合的构造函数中,已经存在了HashSet(int initialCapacity, float loadFactor)这个构造函数,且后者实例化了一个HashMap容器。为了区别开来,实例化LinkedHashMap容器的构造函数才定义了三个参数。

  • 为什么LinkedHashSet集合并没有像HashSet集合那样直接依赖LinkedHashMap容器,而是选择继承HashSet集合后,再在HashSet集合内部通过一个“包保护”特性的构造函数进行LinkedHashMap容器的初始化呢?这主要是为了充分利用HashMap容器和LinkedHashMap容器的继承关系,以及HashSet集合中已经封装的方法。

// LinkedHashSet是HashSet的子类
public class HashSet<E>
  extends AbstractSet<E>
  implements Set<E>, Cloneable, java.io.Serializable 
  
  // 当使用以下构造时,LinkedHashSet内部依赖的Map实现就会变成LinkedHashMap
  // 而由于map属性本身的访问安全性使用private关键字进行修饰
  // 所以LinkedHashSet不能直接为map赋值,只能在HashSet中描述一个构造函数,然后再在LinkedHashSet中进行引用
  private transient HashMap<E,Object> map;  
 
  HashSet(int initialCapacity, float loadFactor, boolean dummy) 
    map = new LinkedHashMap<>(initialCapacity, loadFactor);
  

2.2、LinkedHashSet集合的主要方法

由于LinkedHashSet继承了HashSet集合,且由此沿用了LinkedHashMap容器的所有特性(如果读不懂这句话,说明上一小节没有看明白,还需要重温一下)。所以LinkedHashSet集合无需额外实现任何其他的方法——因为LinkedHashMap容器已经完成了所有需要完成的功能。

当然有个例外,就是LinkedHashSet集合中被覆盖的spliterator()方法,该方法在JDK 1.8+版本中被定义,用来返回一个可分割容器的(并行)迭代器。相关知识我们会在后文中进行说明。

3、TreeSet集合

TreeSet集合是一个基于红黑树的有序集合,它内部功能依赖于TreeMap容器进行工作(后者的工作原理可参见文章《源码阅读(21):Java中其它主要的Map结构——TreeMap容器(1)》) 。TreeSet的主要继承体系如下图所示:

TreeSet集合充分利用了TreeMap容器中Key键特性,实现了TreeSet集合中没有“相同”的元素,以及它基于红黑树工作的特定。以下是TreeSet集合的简单实用示例:

// ......
// 请注意实例代码中,向TreeSet集合放入了java.lang.String类的实例
// java.lang.String类实现了Comparable接口,所以集合中各元素的比较操作将使用
 // String.compareTo(String anotherString)方法进行比较
 TreeSet<String> treeSet = new TreeSet<>();
 treeSet.add("b");
 treeSet.add("d");
 treeSet.add("a");
 treeSet.add("c");
 treeSet.add("1");
 treeSet.add("3");
 treeSet.add("5");
 treeSet.add("4");
 treeSet.add("2");
 
 // 进行遍历
 Iterator<String> itr = treeSet.iterator();
 while(itr.hasNext()) 
   String item = itr.next();
   System.out.println(String.format("item = %s" , item));
 
 
 // ========以上代码的输出结果为
 /*
  * item = 1
  * item = 2
  * item = 3
  * item = 4
  * item = 5
  * item = a
  * item = b
  * item = c
  * item = d
  * */
// ....

3.1、TreeSet集合的构造函数

这里先我们介绍TreeSet集合的构造函数,相关代码片段如下所示:

public class TreeSet<E> extends AbstractSet<E>
  implements NavigableSet<E>, Cloneable, java.io.Serializable 
  
  // ......
  /**
   * 这是TreeSet集合中依赖的Map结构,看似是一个抽象的NavigableMap
   * 实则根据后续的代码分析就可以知道,它是一个TreeMap容器
   * The backing map.
   */
  private transient NavigableMap<E,Object> m;
  
  // ......
  /**
   * 这个构造函数的访问安全设定为“包保户”级别,外部调用者无法直接使用
   * 该构造函数接受一个NavigableMap对象,NavigableMap是大多数Map容器的父级接口,它将成为TreeSet集合内部所依赖的Map容器结构。
   * Constructs a set backed by the specified navigable map.
   */
  TreeSet(NavigableMap<E,Object> m) 
    this.m = m;
  

  // 默认的TreeSet集合构造函数,其内部将TreeSet集合依赖的Map容器初始化为TreeMap。
  public TreeSet() 
    this(new TreeMap<E,Object>());
  

  // 该构造函数将允许传入一个比较器,并为内部的TreeMap容器导入这个比较器
  public TreeSet(Comparator<? super E> comparator) 
    this(new TreeMap<>(comparator));
  

  // 该构造函数允许传入一个其他种类的结合,并在内部完成TreeMap容器的初始化后
  // 将传入集合(c)的元素存入TreeSet容器中
  public TreeSet(Collection<? extends E> c) 
    this();
    addAll(c);
  

  // 该构造函数类似于上一个构造函数,不同的是它允许传入的是一个支持有序排列的Set集合
  public TreeSet(SortedSet<E> s) 
    this(s.comparator());
    addAll(s);
  
  // ......

3.2、TreeSet集合中的主要方法

3.2.1、那些直接封装的方法

由于TreeSet集合的内部依赖了TreeMap容器工作,所以在前者提供的大部分方法中直接调用了TreeMap的对应方法(以NavigableMap抽象类的对象实例进行表达),我们首先来看看:

public class TreeSet<E> extends AbstractSet<E>
  implements NavigableSet<E>, Cloneable, java.io.Serializable 
  
  /**
   * The backing map.
   */
  private transient NavigableMap<E,Object> m;
  
  // Dummy value to associate with an Object in the backing Map
  private static final Object PRESENT = new Object();  

  // ......
  // 向TreeSet集合中添加一个元素
  // 实际上就是调用了TreeMap的put方法,其中的value参数采用了一个常量PRESENT
  public boolean add(E e) 
    return m.put(e, PRESENT)==null;
  
  
  // 清理TreeSet集合中的所有元素
  // 实际上就是调用了TreeMap的clear方法
  public void clear() 
    m.clear();
  
  
  // 清理TreeSet集合中的指定元素
  // 实际上就是调用了TreeMap的remove方法
  public boolean remove(Object o) 
    return m.remove(o)==PRESENT;
  
  
  // 该方法在TreeSet集合中,基于指定的fromElement元素和指定的toElement元素寻找一个子集
  // 如果找到了这个子集,则构造一个新的TreeSet集合进行返回。
  // 其中fromInclusive参数表示返回的子集是否包括起始元素;toInclusive参数表示返回的子集是否包括结束元素
  public NavigableSet<E> subSet(E fromElement, boolean fromInclusive, E toElement,   boolean toInclusive) 
    return new TreeSet<>(m.subMap(fromElement, fromInclusive, toElement,   toInclusive));
  
  
  // 该方法在TreeSet集合中,从集合的第一个元素开始,基于指定的toElement元素截止,寻找一个子集
  // inclusive参数代表子集是否包括了指定的元素
  public NavigableSet<E> headSet(E toElement, boolean inclusive) 
    return new TreeSet<>(m.headMap(toElement, inclusive));
  
  
  // 以及诸如这样的返回TreeSet集合当前第一个元素的方法
  public E first() 
    return m.firstKey();
  
  // ......

3.2.2、那些被修改的方法

在TreeSet集合中,还有一部分原由TreeMap提供的,但是由TreeSet集合进行了“调整”的方法,例如:

public class TreeSet<E> extends AbstractSet<E>
  implements NavigableSet<E>, Cloneable, java.io.Serializable 

  // ......
  public  boolean addAll(Collection<? extends E> c) 
    // Use linear-time version if applicable
    // 如果当前传入的集合有元素,并且当前传入的集合是一个实现了SortedSet接口的有序集合
    if (m.size()==0 && c.size() > 0 && c instanceof SortedSet && m instanceof TreeMap) 
      SortedSet<? extends E> set = (SortedSet<? extends E>) c;
      TreeMap<E,Object> map = (TreeMap<E, Object>) m;
      Comparator<?> cc = set.comparator();
      Comparator<? super E> mc = map.comparator();
      // 且当前TreeSet集合的对比器和传入的集合c使用的对比器“相同”
      // 请注意这个“相同”的定义,除了可以是两者的内存地址相等,还可以是通过equals方法得到了true的返回值
      // 在这些条件都满足的情况下,就是用TreeMap的addAllForTreeSet方法进行元素添加
      if (cc==mc || (cc != null && cc.equals(mc))) 
        map.addAllForTreeSet(set, PRESENT);
        return true;
      
    
    
    // 否则进行集合“c”中的元素一个一个的添加操作
    return super.addAll(c);
  
  // ......


3.2.3、TreeSet集合的序列化方法

和java集合框架中大多数集合/容器的序列化思路一样,为了尽可能保证不进行多余的序列化/反序列化处理,TreeSet集合也重新定义了序列化/反序列化处理过程,代码片段如下所示:

public class TreeSet<E> extends AbstractSet<E>
  implements NavigableSet<E>, Cloneable, java.io.Serializable 
  
  // ......
  // 该方法定义了TreeSet的序列化过程
  private void writeObject(java.io.ObjectOutputStream s) throws java.io.IOException 
    // Write out any hidden stuff
    // 这个方法之前介绍过,既是将对象中各种普通属性(没有标识transient关键字)进行序列化
    s.defaultWriteObject();
    // 将TreeSet集合中使用的TreeMap对象的比较器进行序列化
    // Write out Comparator
    s.writeObject(m.comparator());
    // Write out size
    // 将当前TreeSet集合的大小(size)属性进行序列化
    s.writeInt(m.size());
    // Write out all elements in the proper order.
    // 将TreeSet集合中的有序元素依次进行序列化
    for (E e : m.keySet())
      s.writeObject(e);
  
  
  // 该方法定义了TreeSet的反序列化过程
  private void readObject(java.io.ObjectInputStream s) throws java.io.IOException, ClassNotFoundException 
    // Read in any hidden stuff
    // 通过该方法,将没有标识transient关键字的普通属性进行反序列化
    s.defaultReadObject();
    // Read in Comparator
    @SuppressWarnings("unchecked")
    // 读取当前的比较器对象,并赋予给这个新的TreeSet集合,
    Comparator<? super E> c = (Comparator<? super E>) s.readObject();
    // Create backing TreeMap
    // 为这个TreeSet集合初始化其内部依赖使用的TreeMap容器
    TreeMap<E,Object> tm = new TreeMap<>(c);
    m = tm;
    // Read in size
    // 读取反序列化前集合的大小值,并基于这个值
    // 通过TreeMap容器中提供的readTreeSet方法,依次进行每个元素的反序列化操作
    int size = s.readInt();
    tm.readTreeSet(size, s, PRESENT);
  
  // ......

3、总述

总的来说Java提供的多种原生Set集合其实现都非常简单,都是基于对应的Map集合完成其功能。例如TreeSet内部依赖TreeMap进行工作,HashSet集合内部依赖TreeMap进行工作。所以只需要认证理解阅读本专题之前介绍的多种Map容器,就不难理解这些Set集合了。这也是为什么本专题只花费很少的篇幅就介绍了多种Set集合。

截止这篇文章,JDK1.8中主要的List集合、Queue集合、Map键值对结构和Set集合就介绍完了,从下一片文章开始,我们将进入Java线程、并发特点,以及线程安全的集合框架的讲解。

以上是关于源码阅读(27):Java中主要的Set结构——LinkedHashSetTreeSet等结构的主要内容,如果未能解决你的问题,请参考以下文章

源码阅读(25):Java中主要的Set结构——概述

源码阅读(15):Java中主要的Map结构——概述

源码阅读(10):Java中主要的QueueDeque结构——ArrayDeque集合(上)

源码阅读(12):Java中主要的QueueDeque结构——PriorityQueue集合(上)

源码阅读(11):Java中主要的QueueDeque结构——ArrayDeque集合(下)

源码阅读(13):Java中主要的QueueDeque结构——PriorityQueue集合(中)