java集合之LinkedList源码分析
Posted 爱上口袋的天空
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java集合之LinkedList源码分析相关的知识,希望对你有一定的参考价值。
一、LinkedList简介
1.1、LinkedList概述
- LinkedList是一种可以在任何位置进行高效地插入和移除操作的有序序列,它是基于双向链表实现的。
- LinkedList 是一个继承于AbstractSequentialList的双向链表。它也可以被当作堆栈、队列或双端队列进行操作。
- LinkedList 实现 List 接口,能对它进行队列操作。
- LinkedList 实现 Deque 接口,即能将LinkedList当作双端队列使用。
- LinkedList 实现了Cloneable接口,即覆盖了函数clone(),能克隆。
- LinkedList 实现java.io.Serializable接口,这意味着LinkedList支持序列化,能通过序列化去传输。
- LinkedList 是非同步的。
AbstractSequentialList简介:
( Sequential 相继的,按次序的)
AbstractSequentialList 继承自 AbstractList,是
LinkedList
的父类,是 List 接口 的简化版实现。简化在哪儿呢?简化在 AbstractSequentialList 只支持按次序访问,而不像 AbstractList 那样支持随机访问。
想要实现一个支持按次序访问的 List的话,只需要继承这个抽象类,然后把指定的抽象方法实现就好了。需要实现的方法:
- size()
- listIterator(),返回一个 ListIterator
你需要实现一个
ListIterator
, 实现它的hasNext()
,hasPrevious()
,next()
,previous()
, 还有那几个 获取位置 的方法,这样你就得到一个不可变的 ListIterator 了。如果你想让它可修改,还需要实现add()
,remove()
,set()
方法。
1.2、LinkedList的数据结构
1)基础知识补充
1.1)单向链表:
element:用来存放元素
next:用来指向下一个节点元素
通过每个结点的指针指向下一个结点从而链接起来的结构,最后一个节点的next指向null。1.2)单向循环链表
element、next 跟前面一样
在单向链表的最后一个节点的next会指向头节点,而不是指向null,这样存成一个环
1.3)双向链表
element:存放元素
pre:用来指向前一个元素
next:指向后一个元素
双向链表是包含两个指针的,pre指向前一个节点,next指向后一个节点,但是第一个节点head的pre指向null,最后一个节点的tail指向null。
1.4)双向循环链表
element、pre、next 跟前面的一样
第一个节点的pre指向最后一个节点,最后一个节点的next指向第一个节点,也形成一个环
2)LinkedList的数据结构
如上图所示,LinkedList底层使用的双向链表结构,有一个头结点和一个尾结点,双向链表意味着我们可以从头开始正向遍历,或者是从尾开始逆向遍历,并且可以针对头部和尾部进行相应的操作。
1.3、LinkedList的特性
在我们平常中我们只知道一些常识性的特点:
1)是通过链表实现的,
2)如果在频繁的插入,或者删除数据时,就用linkedList性能会更好。
那我们通过API去查看它的一些特性
1)Doubly-linked list implementation of the
List
andDeque
interfaces. Implements all optional list operations, and permits all elements (includingnull
).这告诉我们,linkedList是一个双向链表,并且实现了List和Deque接口中所有的列表操作,并且能存储任何元素,包括null,
这里我们可以知道linkedList除了可以当链表使用,还可以当作队列使用,并能进行相应的操作。
2)All of the operations perform as could be expected for a doubly-linked list. Operations that index into the list will traverse the list from the beginning or the end, whichever is closer to the specified index.
这个告诉我们,linkedList在执行任何操作的时候,都必须先遍历此列表来靠近通过index查找我们所需要的的值。通俗点讲,这就告诉了我们这个是顺序存取,
每次操作必须先按开始到结束的顺序遍历,随机存取,就是arrayList,能够通过index。随便访问其中的任意位置的数据,这就是随机列表的意思。
3)api中接下来讲的一大堆,就是说明linkedList是一个非线程安全的(异步),其中在操作Interator时,如果改变列表结构(add\\delete等),会发生fail-fast。
通过API再次总结一下LinkedList的特性:
1)异步,也就是非线程安全
2)双向链表。由于实现了list和Deque接口,能够当作队列来使用。
链表:查询效率不高,但是插入和删除这种操作性能好。
3)是顺序存取结构(注意和随机存取结构两个概念搞清楚)
二、LinkedList源码分析
2.1、LinkedList的继承结构以及层次关系
分析:
我们可以看到,linkedList在最底层,说明他的功能最为强大,并且细心的还会发现,arrayList只有四层,这里多了一层AbstractSequentialList的抽象类,为什么呢?
1)减少实现顺序存取(例如LinkedList)这种类的工作,通俗的讲就是方便,抽象出类似LinkedList这种类的一些共同的方法
2) 既然有了上面这句话,那么以后如果自己想实现顺序存取这种特性的类(就是链表形式),那么就继承这个AbstractSequentialList抽象类,如果想像数组那样的随机存取的类,那么就去实现AbstracList抽象类。
3) 这样的分层,就很符合我们抽象的概念,越在高处的类,就越抽象,往在底层的类,就越有自己独特的个性。自己要慢慢领会这种思想。
4)LinkedList的类继承结构很有意思,我们着重要看是Deque接口,Deque接口表示是一个双端队列,那么也意味着LinkedList是双端队列的一种实现,所以,基于双端队列的操作在LinkedList中全部有效。
实现接口分析:
1)List接口:列表,add、set、等一些对列表进行操作的方法
2)Deque接口:有队列的各种特性,
3)Cloneable接口:能够复制,使用那个copy方法。
4)Serializable接口:能够序列化。
5)应该注意到没有RandomAccess:那么就推荐使用iterator,在其中就有一个foreach,增强的for循环,其中原理也就是iterator,我们在使用的时候,使用foreach或者iterator都可以。
2.2、类的属性
public class LinkedList<E> extends AbstractSequentialList<E> implements List<E>, Deque<E>, Cloneable, java.io.Serializable // 实际元素个数 transient int size = 0; // 头结点 transient Node<E> first; // 尾结点 transient Node<E> last;
LinkedList的属性非常简单,一个头结点、一个尾结点、一个表示链表中实际元素个数的变量。注意,头结点、尾结点都有transient关键字修饰,这也意味着在序列化时该域是不会序列化的。
2.3、LinkedList的构造方法
两个构造方法(两个构造方法都是规范规定需要写的)
1)空参构造函数
/** * Constructs an empty list. */ public LinkedList()
2)有参构造函数
/** * Constructs a list containing the elements of the specified * collection, in the order they are returned by the collection's * iterator. * * @param c the collection whose elements are to be placed into this list * @throws NullPointerException if the specified collection is null */ //将集合c中的各个元素构建成LinkedList链表。 public LinkedList(Collection<? extends E> c) // 调用无参构造函数 this(); // 添加集合中所有的元素 addAll(c);
说明:会调用无参构造函数,并且会把集合中所有的元素添加到LinkedList中。
2.4、内部类(Node)
//根据前面介绍双向链表就知道这个代表什么了,linkedList的奥秘就在这里。 private static class Node<E> E item; // 数据域(当前节点的值) Node<E> next; // 后继(指向当前一个节点的后一个节点) Node<E> prev; // 前驱(指向当前节点的前一个节点) // 构造函数,赋值前驱后继 Node(Node<E> prev, E element, Node<E> next) this.item = element; this.next = next; this.prev = prev;
说明:内部类Node就是实际的结点,用于存放实际元素的地方。
2.5、核心方法
2.5.1、add方法
1)、add(E)方法
/** 新增元素 * Appends the specified element to the end of this list. * * <p>This method is equivalent to @link #addLast. * * @param e element to be appended to this list * @return @code true (as specified by @link Collection#add) */ public boolean add(E e) linkLast(e);//将元素添加到末尾 return true;
/** * Links e as last element. */ void linkLast(E e) final Node<E> l = last; //临时节点l(L的小写)保存last,也就是l指向了最后一个节点 final Node<E> newNode = new Node<>(l, e, null);//将e封装为节点,并且e.prev指向了最后一个节点 last = newNode;//newNode成为了最后一个节点,所以last指向了它 if (l == null) //判断是不是一开始链表中就什么都没有,如果没有,则newNode就成为了第一个节点,first和last都要指向它 first = newNode; else //正常的在最后一个节点后追加,那么原先的最后一个节点的next就要指向现在真正的最后一个节点,原先的最后一个节点就变成了倒数第二个节点 l.next = newNode; size++;//添加一个节点,size自增 modCount++;
2.5.2、addAll方法
addAll有两个重载函数,addAll(Collection<? extends E>)型和addAll(int, Collection<? extends E>)型,我们平时习惯调用的addAll(Collection<? extends E>)型会转化为addAll(int, Collection<? extends E>)型
1)、addAll(Collection<? extends E> c)方法
/** * Appends all of the elements in the specified collection to the end of * this list, in the order that they are returned by the specified * collection's iterator. The behavior of this operation is undefined if * the specified collection is modified while the operation is in * progress. (Note that this will occur if the specified collection is * this list, and it's nonempty.) * * @param c collection containing elements to be added to this list * @return @code true if this list changed as a result of the call * @throws NullPointerException if the specified collection is null */ public boolean addAll(Collection<? extends E> c) return addAll(size, c);
1)、addAll(int index, Collection<? extends E> c)方法
/** * Inserts all of the elements in the specified collection into this * list, starting at the specified position. Shifts the element * currently at that position (if any) and any subsequent elements to * the right (increases their indices). The new elements will appear * in the list in the order that they are returned by the * specified collection's iterator. * * @param index index at which to insert the first element * from the specified collection * @param c collection containing elements to be added to this list * @return @code true if this list changed as a result of the call * @throws IndexOutOfBoundsException @inheritDoc * @throws NullPointerException if the specified collection is null */ public boolean addAll(int index, Collection<? extends E> c) checkPositionIndex(index);//检查index这个是否为合理,其实就是检查角标是否小于0或者是否越界 Object[] a = c.toArray();//将集合c转换为Object数组 a int numNew = a.length;//获取数组a的长度 if (numNew == 0) return false; Node<E> pred, succ;//集合c是非空的,定义两个节点(内部类),每个节点都有三个属性,item、next、prev,就是用来做临时存储节点的 if (index == size) succ = null; pred = last;//在结尾追加元素 else //如果在链表中间插入元素,那么就得知道index上的节点是谁,保存到succ临时节点中,然后将succ的前一个节点保存到pred中,这样保存了这两个节点,就能够准确的插入节点了 succ = node(index); pred = succ.prev; for (Object o : a) //前面的准备工作做完了,将遍历数组a中的元素,封装为一个个节点。 @SuppressWarnings("unchecked") E e = (E) o; Node<E> newNode = new Node<>(pred, e, null);//构建一个Node节点,pre为pred,e为当前元素,next为null if (pred == null) first = newNode;//如果pred为空,说明是一个空链表,此时的newNode就当作第一个节点,所以把newNode给first头节点 else pred.next = newNode;//如果pred!=null,说明需要将newNode挂载pred的next上 pred = newNode;//构建 if (succ == null) last = pred; else pred.next = succ; succ.prev = pred; size += numNew; modCount++; return true;
说明:参数中的index表示在索引下标为index的结点(实际上是第index + 1个结点)的前面插入。在addAll函数中,addAll函数中还会调用到node函数,get函数也会调用到node函数,此函数是根据索引下标找到该结点并返回,具体代码如下:
Node<E> node(int index) // 判断插入的位置在链表前半段或者是后半段 if (index < (size >> 1)) // 插入位置在前半段 Node<E> x = first; for (int i = 0; i < index; i++) // 从头结点开始正向遍历 x = x.next; return x; // 返回该结点 else // 插入位置在后半段 Node<E> x = last; for (int i = size - 1; i > index; i--) // 从尾结点开始反向遍历 x = x.prev; return x; // 返回该结点
addAll()中的一个问题:
在addAll函数中,传入一个集合参数和插入位置,然后将集合转化为数组,然后再遍历数组,挨个添加数组的元素,但是问题来了,为什么要先转化为数组再进行遍历,而不是直接遍历集合呢?
从效果上两者是完全等价的,都可以达到遍历的效果。关于为什么要转化为数组的问题,我的思考如下:
1. 如果直接遍历集合的话,那么在遍历过程中需要插入元素,在堆上分配内存空间,修改指针域,这个过程中就会一直占用着这个集合,考虑正确同步的话,其他线程只能一直等待。
2. 如果转化为数组,只需要遍历集合,而遍历集合过程中不需要额外的操作,所以占用的时间相对是较短的,这样就利于其他线程尽快的使用这个集合。说白了,就是有利于提高多线程访问该集合的效率,尽可能短时间的阻塞。
2.5.3、remove(Object o)
/** //首先通过看上面的注释,我们可以知道,如果我们要移除的值在链表中存在多个一样的值,那么我们会移除index最小的那个,也就是最先找到的那个值, 如果不存在这个值,那么什么也不做 * Removes the first occurrence of the specified element from this list, * if it is present. If this list does not contain the element, it is * unchanged. More formally, removes the element with the lowest index * @code i such that * <tt>(o==null ? get(i)==null : o.equals(get(i)))</tt> * (if such an element exists). Returns @code true if this list * contained the specified element (or equivalently, if this list * changed as a result of the call). * * @param o element to be removed from this list, if present * @return @code true if this list contained the specified element */ public boolean remove(Object o) if (o == null) for (Node<E> x = first; x != null; x = x.next) //循环遍历链表,直到找到null值,然后使用unlink移除该值。下面的这个else中也一样 if (x.item == null) unlink(x);//使用unlink移除该值 return true; else for (Node<E> x = first; x != null; x = x.next) if (o.equals(x.item)) unlink(x);//使用unlink移除该值 return true; return false;
/** * Unlinks non-null node x. */ E unlink(Node<E> x) // assert x != null; //拿到节点x的三个属性 final E element = x.item; final Node<E> next = x.next; final Node<E> prev = x.prev; //这里开始往下就进行移除该元素之后的操作,也就是把指向哪个节点搞定。 if (prev == null) first = next;//说明移除的节点是头节点,则first头节点应该指向下一个节点 else prev.next = next;//不是头节点,prev.next=next:有1、2、3,将1.next指向3 x.prev = null;//然后解除x节点的前指向。 if (next == null) last = prev;//说明移除的节点是尾节点 else //不是尾节点,有1、2、3,将3.prev指向1. 然后将2.next=解除指向。 next.prev = prev; x.next = null; //x的前后指向都为null了,也把item为null,让gc回收它 x.item = null; size--; //移除一个节点,size自减 modCount++; return element;
2.5.4、get(index)
/** * Returns the element at the specified position in this list. * * @param index index of the element to return * @return the element at the specified position in this list * @throws IndexOutOfBoundsException @inheritDoc */ //这里没有什么,重点还是在node(index)中 public E get(int index) checkElementIndex(index); return node(index).item;
/** * Returns the (non-null) Node at the specified element index. */ //这里查询使用的是先从中间分一半查找 Node<E> node(int index) // assert isElementIndex(index); //"<<":*2的几次方 “>>”:/2的几次方,例如:size<<1:size*2的1次方, //这个if中就是查询前半部分 if (index < (size >> 1)) //index<size/2 Node<E> x = first; for (int i = 0; i < index; i++) x = x.next; return x; else //前半部分没找到,所以找后半部分 Node<E> x = last; for (int i = size - 1; i > index; i--) x = x.prev; return x;
2.5.5、indexOf(Object o)
//这个很简单,就是通过实体元素来查找到该元素在链表中的位置。跟remove中的代码类似,只是返回类型不一样。 public int indexOf(Object o) int index = 0; if (o == null) for (Node<E> x = first; x != null; x = x.next) if (x.item == null) return index; index++; else for (Node<E> x = first; x != null; x = x.next) if (o.equals(x.item)) return index; index++; return -1;
三、LinkedList的迭代器
3.1、ListItr内部类
看一下他的继承结构,发现只继承了一个ListIterator,到ListIterator中一看:
看到方法名之后,就发现不止有向后迭代的方法,还有向前迭代的方法,所以我们就知道了这个ListItr这个内部类干嘛用的了,就是能让linkedList不光能像后迭代,也能向前迭代。
看一下ListItr中的方法,可以发现,在迭代的过程中,还能移除、修改、添加值得操作。
3.2、DescendingIterator内部类
/** * Adapter to provide descending iterators via ListItr.previous */ 看一下这个类,还是调用的ListItr,作用是封装一下Itr中几个方法,让使用者以正常的思维去写代码,例如,在从后往前遍历的时候,也是跟从前往后遍历一样,使用next等操作,而不用使用特殊的previous。 private class DescendingIterator implements Iterator<E> private final ListItr itr = new ListItr(size()); public boolean hasNext() return itr.hasPrevious(); public E next() return itr.previous(); public void remove() itr.remove();
四、总结
1)linkedList本质上是一个双向链表,通过一个Node内部类实现的这种链表结构。
2)能存储null值
3)跟arrayList相比较,就真正的知道了,LinkedList在删除和增加等操作上性能好,而ArrayList在查询的性能上好
4)从源码中看,它不存在容量不足的情况
5)linkedList不光能够向前迭代,还能像后迭代,并且在迭代的过程中,可以修改值、添加值、还能移除值。
6)linkedList不光能当链表,还能当队列使用,这个就是因为实现了Deque接口。
以上是关于java集合之LinkedList源码分析的主要内容,如果未能解决你的问题,请参考以下文章