java容器篇

Posted 2021-01-01 yonyong

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了java容器篇相关的知识，希望对你有一定的参考价值。

容器
     -Collection 存储对象的集合；Map 存储键值对的映射表
     -Iterator(迭代器模式)
         -集合访问器，用于循环访问集合中的对象
         -所有实现了Collection接口的容器类都有iterator方法，用于返回一个实现了Iterator接口的对象。Iterator对象称作迭代器，Iterator接口方法能以迭代方式逐个访问集合中各个元素，并可以从Collection中除去适当的元素
     -Collection
         -set(特征：无序且不可重复)
             -TreeSet：基于红黑树实现，支持有序性操作，例如根据一个范围查找元素的操作。但是查找效率不如 HashSet，HashSet 查找的时间复杂度为 O(1)，TreeSet 则为 O(logN)。
             -HashSet:基于哈希表实现，支持快速查找，但不支持有序性操作。并且失去了元素的插入顺序信息，也就是说使用 Iterator 遍历 HashSet 得到的结果是不确定的
             -LinkedHashSet:具有 HashSet 的查找效率，且内部使用双向链表维护元素的插入顺序
             -红黑树：漫画看懂红黑树链接：https://www.sohu.com/a/201923614_466939
         -list(特征：有序且可重复)
             -ArrayList：基于动态数组实现，支持随机访问。
                 -概览
                     -实现了 RandomAccess 接口，因此支持随机访问。这是理所当然的，因为 ArrayList 是基于数组实现的，其数组的默认大小为 10。
                 -序列化
                     -基于数组实现，并且具有动态扩容特性，因此保存元素的数组不一定都会被使用，那么就没必要全部进行序列
                      transient Object[] A; //transient关键字声明数组默认不会被序列化
                         -为什么定义A数组要用transient关键字修饰，使其默认不被序列化？
                             假如现在实际有了5个元素，而elementData的大小可能是10，那么在序列化时只需要储存5个元素，数组中的最后五个元素是没有实际意义的，不需要储存。所以ArrayList的设计者将elementData设计为transient，然后在writeObject方法中手动将其序列化，并且只序列化了实际存储的那些元素，而不是整个数组
                     -序列化时需要使用 ObjectOutputStream 的 writeObject() 将对象转换为字节流并输出。而 writeObject() 方法在传入的对象存在 writeObject() 的时候会去反射调用该对象的 writeObject() 来实现序列化。反序列化使用的是 ObjectInputStream 的 readObject() 方法，原理类似。
                     -java中序列化的目的：
                         -以某种存储形式使自定义对象持久化；
                         -将对象从一个地方传递到另一个地方。
                         -使程序更具维护性
                 -扩容
                     -添加元素时使用 ensureCapacityInternal() 方法来保证容量足够，如果不够时，需要使用 grow() 方法进行扩容，新容量的大小为 oldCapacity + (oldCapacity >> 1)，也就是旧容量的 1.5 倍
                     -扩容操作需要调用 Arrays.copyOf() 把原数组整个复制到新数组中，这个操作代价很高，因此最好在创建 ArrayList 对象时就指定大概的容量大小，减少扩容操作的次数
                 -删除元素
                     -需要调用 System.arraycopy() 将 index+1 后面的元素都复制到 index 位置上，该操作的时间复杂度为 O(N)， ArrayList 删除元素的代价是非常高的。
                 -fail-fast
                     -modCount 用来记录 ArrayList 结构发生变化的次数。结构发生变化是指添加或者删除至少一个元素的所有操作，或者是调整内部数组的大小，仅仅只是设置元素的值不算结构发生变化
                     -在进行序列化或者迭代等操作时，需要比较操作前后 modCount 是否改变，如果改变了需要抛出 ConcurrentModificationException。
                 -fail-fast与fail-safe
                     -fail-fast
                         -fail-fast机制在遍历一个集合时，当集合结构被修改，会抛出ConcurrentModificationException。
                         -java.util包下的集合类都是快速失败的，不能在多线程下发生并发修改（迭代过程中被修改）。
                     -fail-safe
                         -fail-safe任何对集合结构的修改都会在一个复制的集合上进行修改，不像fail-fast在原集合上修改，因此不会抛出ConcurrentModificationException
                         -java.util.concurrent包下的容器都是安全失败，可以在多线程下并发使用，并发修改。
                         -优点
                             -避免了ConcurrentModificationException
                         -缺点
                             -需要复制集合，产生大量的无效对象，开销大
                             -无法保证读取的数据是目前原始数据结构中的数据。
                             -迭代器并不能访问到修改后的内容，即：迭代器遍历的是开始遍历那一刻拿到的集合拷贝，在遍历期间原集合发生的修改迭代器是不知道的。
             -Vector：和 ArrayList 类似，但它是线程安全的。
                 -它的实现与 ArrayList 类似，但是使用了 synchronized 进行同步。因此是线程安全的
                 -与ArrayList比较
                     -Vector 是同步的，因此开销就比 ArrayList 要大，访问速度更慢。最好使用 ArrayList 而不是 Vector，因为同步操作完全可以由程序员自己来控制；
                     -Vector 每次扩容请求其大小的 2 倍空间，而 ArrayList 是 1.5 倍。
             -LinkedList：基于双向链表实现，只能顺序访问，但是可以快速地在链表中间插入和删除元素。不仅如此，LinkedList 还可以用作栈、队列和双向队列。
                 -概览
                     -基于双向链表实现，使用 Node 存储链表节点信息。
                       private static class Node<E> {
                             E item;
                             Node<E> next;
                             Node<E> prev;
                         }
                       每个链表存储了 first 和 last 指针
                       transient Node<E> first;
                       transient Node<E> last;
                 -与 ArrayList 的比较
                     -ArrayList 基于动态数组实现，LinkedList 基于双向链表实现；
                     -ArrayList 支持随机访问，LinkedList 不支持；
                     -LinkedList 在任意位置添加删除元素更快。
     -Map
         -TreeMap：基于红黑树实现
         -HashMap：基于哈希表实现。
             -存储结构
                 -内部包含了一个 Entry 类型的数组 table。
                     transient Entry[] table;
                     Entry 存储着键值对。它包含了四个字段，从 next 字段我们可以看出 Entry 是一个链表。即数组中的每个位置被当成一个桶，一个桶存放一个链表。HashMap 使用拉链法来解决冲突，同一个链表中存放哈希值相同的 Entry。
                     {{{{{{{entry结构图}}}}}}}
             - 拉链法的工作原理
                 HashMap<String, String> map = new HashMap<>();
                 map.put("K1", "V1");
                 map.put("K2", "V2");
                 map.put("K3", "V3");
                 新建一个 HashMap，默认大小为 16；
                 插入 <K1,V1> 键值对，先计算 K1 的 hashCode 为 115，使用除留余数法得到所在的桶下标 115%16=3。
                 插入 <K2,V2> 键值对，先计算 K2 的 hashCode 为 118，使用除留余数法得到所在的桶下标 118%16=6。
                 插入 <K3,V3> 键值对，先计算 K3 的 hashCode 为 118，使用除留余数法得到所在的桶下标 118%16=6，插在 <K2,V2> 前面。

                 -应该注意到链表的插入是以头插法方式进行的，例如上面的 <K3,V3> 不是插在 <K2,V2> 后面，而是插入在链表头部。
                 -查找需要分成两步进行：
                     -计算键值对所在的桶；
                     -在链表上顺序查找，时间复杂度显然和链表的长度成正比。
             -put操作
                 -HashMap 允许插入键为 null 的键值对。但是因为无法调用 null 的 hashCode() 方法，也就无法确定该键值对的桶下标，只能通过强制指定一个桶下标来存放。HashMap 使用第 0 个桶存放键为 null 的键值对。
             -确定桶下标
             -扩容
                 -基本原理
                 -重新计算桶下标
                 -计算数组容量
             -链表转红黑树
                 -从 JDK 1.8 开始，一个桶存储的链表长度大于 8 时会将链表转换为红黑树
             -与 HashTable 的比较
                 HashTable 使用 synchronized 来进行同步。
                 HashMap 可以插入键为 null 的 Entry。
                 HashMap 的迭代器是 fail-fast 迭代器。
                 HashMap 不能保证随着时间的推移 Map 中的元素次序是不变的。
         -HashTable：和 HashMap 类似，但它是线程安全的，这意味着同一时刻多个线程可以同时写入 HashTable 并且不会导致数据不一致。它是遗留类，不应该去使用它。现在可以使用 ConcurrentHashMap 来支持线程安全，并且 ConcurrentHashMap 的效率会更高，因为 ConcurrentHashMap 引入了分段锁。
         -LinkedHashMap：使用双向链表来维护元素的顺序，顺序为插入顺序或者最近最少使用（LRU）顺序。

以上是关于java容器篇的主要内容，如果未能解决你的问题，请参考以下文章