ArrayList源码解析

Posted firepation

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ArrayList源码解析相关的知识,希望对你有一定的参考价值。

1. 引言

上个月去一家公司面试 java 实习生,面试官说的一句话我记得很清楚 作为一个java 工程师,你不去看源码是很难提高的。通过看源码,不仅可以更快的解决问题,而且可以直接接触到大牛写的代码,了解他们的设计思想,是有很大的好处的。 虽然后面由于种种原因把实习给辞了,不过面试官给的建议我认为是有用的,从今天开始了解一下 JDK 中集合框架的源码,以此提升自己。

查看 JDK 版本为 1.8。另外,由于本人只是水平有限,因此博客中有问题欢迎大家指出。

2. 概要

ArrayList 底层的数据结构很简单,就是利用数组来完成的。在源码中是这样定义的:transient Object[] elementData; ,根据构造函数的不同,其初始化方式也不同。其默认大小为 10。

这里为什么要使用 transient 关键字修饰呢?通过网上查找资料了解到,elementData 数组中的元素并不总是满的,例如数组长度为 10 而存储的元素只有五个。ArrayList 自定义了自己的 wirteObject 方法,保证只有这五个元素被序列化。

还需要注意的一点是,ArrayList 不是线程安全的,在多线程条件下,可以考虑使用 Collections.synchronizedList(List list) 来返回一个线程安全的 ArrayList。也可以使用 concurrent 包下的 CopyOnWriteArrayList 类。

3. 常用 API

3.1 扩容

ArrayList 底层虽然是使用数组存储数据,但我们并不需要担心会发生数组越界的情况。每次添加元素时,内部都会执行一个方法 ensureCapacityInternal(int minCapacity) ,传入的参数为当前数组长度+1,即现在 ArrayList 需要的最小容量,判断添加一个元素之后是否会存在数组越界的情况。

private void ensureCapacityInternal(int minCapacity) {
   if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    ensureExplicitCapacity(minCapacity);
}

ensureExplicitCapacity 函数中,比较 ArrayList 需要的最小容量和当前数组的长度大小,判断是否进行扩容,如果需要的话,则调用 grow 方法。通过查看源代码,发现,它扩容后的大小一般为原数组的 1.5 倍。当然数组的长度也是有限的,它的最大长度为 Integer.MAX_VALUE - 8

private void grow(int minCapacity) {
    // overflow-conscious code
    int oldCapacity = elementData.length;
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // minCapacity is usually close to size, so this is a win:
    elementData = Arrays.copyOf(elementData, newCapacity);
}

3.2 添加元素

了解了 ArrayList 的扩容过程,那么添加元素这个函数就变得简单了。其实现如下,其中 size 表示当前 ArrayList 元素的个数,添加元素直接对下标为 index 的位置赋值。

public boolean add(E e) {
     ensureCapacityInternal(size + 1);  
     elementData[size++] = e;
     return true;
 }

3.3 删除元素

在 ArrayList 中,有两种删除元素的方法

一个是通过角标:public E remove(int index)。其思路是找到指定位置,通过 Systemarraycopy 方法将下标 index 后的元素复制到原数组中直接覆盖下标为 index 的元素,以此达到删除的效果。

 public E remove(int index) {
     rangeCheck(index);

     modCount++;
     E oldValue = elementData(index);

     int numMoved = size - index - 1;
     if (numMoved > 0)
         System.arraycopy(elementData, index+1, elementData, index,
                          numMoved);
     elementData[--size] = null; // clear to let GC do its work

     return oldValue;
 }

另一个是直接删除指定的元素:public boolean remove(Object o)。删除指定元素,第一步先判断 o 对象是否为 null,如果是的话,删除数组中值为 null 的元素,如果不是,则删除指定的元素。其最终删除的方法也是通过赋值数组来完成,这里就不再重复。

3.4 修改元素、查找元素

修改元素与查找元素实现的原理差不多,其中应该注意的是在修改或者查找元素之前,应该先判断下需要查找的下标是否超出数组的长度,如果是的话,就应该抛出一个异常。ArrayList 是通过 rangeCheck 来判断的。

public E set(int index, E element) {
    rangeCheck(index);

    E oldValue = elementData(index);
    elementData[index] = element;
    return oldValue;
}

以上是关于ArrayList源码解析的主要内容,如果未能解决你的问题,请参考以下文章

CopyOnWriteArrayList源码解析

设计模式 行为型模式 -- 迭代器模式 JDK源码解析:ArrayList

ArrayList 源码解析

Java 集合深入理解 :ArrayList源码解析,及动态扩容机制

源码解读:ArrayList源码解析(JDK8)

ArrayList源码解析