ArrayList扩容机制

Posted hequnwang10

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ArrayList扩容机制相关的知识,希望对你有一定的参考价值。

ArrayList 的底层就是一个数组,依赖其扩容机制(后面会提到)它能够实现容量的动态增长,所以 ArrayList 就是数据结构中顺序表的一种具体实现。

其特点为:查询快,增删慢,线程不安全,效率高。

优点:

  1. 逻辑与物理顺序一致,顺序表能够按照下标直接快速的存取元素
  2. 无须为了表示表中元素之间的逻辑关系而增加额外的存储空间

缺点:

  1. 线性表长度需要初始定义,常常难以确定存储空间的容量,所以只能以降低效率的代价使用扩容机制
  2. 插入和删除操作需要移动大量的元素,效率较低

举个例子:

  • 首先最好的情况是这样的,元素在末尾的位置插入,这样无论该元素进行什么操作,均不会对其他元素产生什么影响,所以它的时间复杂度为 O(1)

  • 那么最坏的情况又是这样的,元素正好插入到第一个位置上,这就意味着后面的所有元素全部需要移动一个位置,所以时间复杂度为 O(n)

  • 平均的情况呢,由于在每一个位置插入的概率都是相同的,而插入越靠前移动的元素越多,所以平均情况就与中间那个值的一定次数相等,为 (n - 1) / 2 ,平均时间复杂度还是 O(n)

一、源码分析

1、类声明

一个继承(抽象类)和四个接口关系

public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable
  • RandomAccess 是一个标志接口(Marker)只要 List 集合实现这个接口,就能支持快速随机访问(通过元素序号快速获取元素对象 —— get(int index))

  • Cloneable :实现它就可以进行克隆(clone())

  • java.io.Serializable :实现它意味着支持序列化,满足了序列化传输的条件

2、类成员

// 序列化自动生成的一个码,用来在正反序列化中验证版本一致性。
private static final long serialVersionUID = 8683452581122892189L;

/**
 * 默认初始容量大小为10
 */
private static final int DEFAULT_CAPACITY = 10;

/**
 * 指定 ArrayList 容量为0(空实例)时,返回此空数组
 */
private static final Object[] EMPTY_ELEMENTDATA = ;

/**
 * 与 EMPTY_ELEMENTDATA 的区别是,它是默认返回的,而前者是用户指定容量为 0 才返回
 */
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = ;

/**
 * 具体存放元素的数组
 * 保存添加到 ArrayList 中的元素数据(第一次添加元素时,会扩容到 DEFAULT_CAPACITY = 10 ) 
 */
transient Object[] elementData; // non-private to simplify nested class access

/**
 * ArrayList 实际所含元素个数(大小)
 */
private int size;

3、构造方法

/**
 * 带参构造函数,参数为用户指定的初始容量
 */
public ArrayList(int initialCapacity) 
    if (initialCapacity > 0) 
        // 参数大于0,创建 initialCapacity 大小的数组
        this.elementData = new Object[initialCapacity];
     else if (initialCapacity == 0) 
        // 参数为0,创建空数组(成员中有定义)
        this.elementData = EMPTY_ELEMENTDATA;
     else 
        // 其他情况,直接抛异常
        throw new IllegalArgumentException("Illegal Capacity: "+
                                           initialCapacity);
    


/**
 * 默认无参构造函数,初始值为 0
 * 也说明 DEFAULT_CAPACITY = 10 这个容量
 * 不是在构造函数初始化的时候设定的(而是在添加第一个元素的时候)
 */
public ArrayList() 
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;


/**
 * 构造一个包含指定 collection 的元素的列表
 * 这些元素是按照该 collection 的迭代器返回它们的顺序排列的。
 */
public ArrayList(Collection<? extends E> c) 
    // 将给定的集合转成数组
    elementData = c.toArray();
    // 如果数组长度不为 0
    if ((size = elementData.length) != 0) 
        // elementData 如果不是 Object 类型的数据,返回的就不是 Object 类型的数组
        if (elementData.getClass() != Object[].class)
            // 将不是 Object 类型的 elementData 数组,赋值给一个新的 Object 类型的数组
            elementData = Arrays.copyOf(elementData, size, Object[].class);
     else 
        // 数组长度为 0 ,用空数组代替
        this.elementData = EMPTY_ELEMENTDATA;
    


4、最小化实例容量方法

/**
 * 最小化实例容量方法,可以根据实际元素个数,将数组容量优化,防止浪费
 */
public void trimToSize() 
    modCount++;
    // 数组容量大于实际元素个数(例如10个元素,却有15个容量)
    if (size < elementData.length) 
        // 根据元素实际个数,重新最小化实例容量
        elementData = (size == 0)
            ? EMPTY_ELEMENTDATA
            : Arrays.copyOf(elementData, size);
    

二、扩容方法

/**
 * 增加ArrayList实例的容量,如果有必要,确保它至少可以保存由最小容量参数指定的元素数量。
 */
public void ensureCapacity(int minCapacity) 
    //如果元素数组不为默认的空,则 minExpand 的值为0,反之值为10
    int minExpand = (elementData != DEFAULTCAPACITY_EMPTY_ELEMENTDATA)
        // any size if not default element table
        ? 0
        // larger than default for default empty table. It's already
        // supposed to be at default size.
        : DEFAULT_CAPACITY;
    // 如果最小容量大于已有的最大容量
    if (minCapacity > minExpand) 
        ensureExplicitCapacity(minCapacity);
    


/**
 * 计算最小扩容量(被调用)
 */
private static int calculateCapacity(Object[] elementData, int minCapacity) 
     // 如果元素数组为默认的空
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) 
        // 获取“默认的容量”和“传入参数 minCapacity ”两者之间的最大值
        return Math.max(DEFAULT_CAPACITY, minCapacity);
    
    return minCapacity;


/**
 * 得到最小扩容量
 */
private void ensureCapacityInternal(int minCapacity) 
    ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));



/**
 * 判断是否需要扩容
 */
private void ensureExplicitCapacity(int minCapacity) 
    modCount++;
    // overflow-conscious code
    // 如果最小容量比数组的长度还大
    if (minCapacity - elementData.length > 0)
        // 就调用grow方法进行扩容
        grow(minCapacity);


/**
 * 要分配的最大数组大小
 */
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

/**
 * ArrayList 扩容的核心方法
 */
private void grow(int minCapacity) 
    // 将当前元素数组长度定义为 oldCapacity 旧容量
    int oldCapacity = elementData.length;
    // 新容量更新为旧容量的1.5倍
    // oldCapacity >> 1 为按位右移一位,相当于 oldCapacity 除以2的1次幂
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    // 然后检查新容量是否大于最小需要容量,若还小,就把最小需要容量当作数组的新容量
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    // 再检查新容量是否超出了ArrayList 所定义的最大容量
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        // 若超出,则调用hugeCapacity()
        newCapacity = hugeCapacity(minCapacity);
    elementData = Arrays.copyOf(elementData, newCapacity);

	
/**
 * 比较minCapacity和 MAX_ARRAY_SIZE
 */
private static int hugeCapacity(int minCapacity) 
    if (minCapacity < 0) // overflow
        throw new OutOfMemoryError();
    return (minCapacity > MAX_ARRAY_SIZE) ?
        Integer.MAX_VALUE :
    MAX_ARRAY_SIZE;

1、ArrayList 初始化

ArrayList 提供了 1 个无参构造和 2 个带参构造来初始化 ArrayList ,我们在创建 ArrayList 时,经常使用无参构造的方式,其本质就是初始化了一个空数组,直到向数组内真的添加元素的时候才会真的去分配容量。例如:向数组中添加第一个元素,数组容量扩充为 10

2、 扩容机制流程分析(无参构造为例)

2.1、add()

一般来说,都是通过 add 方法触发扩容机制,我们拿最简单的尾部追加的 add() 方法举例

/**
 * 将指定的元素追加到此列表的末尾。
 */
public boolean add(E e) 
    // 确认 list 容量,尝试容量加 1,看看有无必要扩容
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    // 赋值
    elementData[size++] = e;
    return true;

核心要点就这一句 ensureCapacityInternal(size + 1);

2.2、ensureCapacityInternal()
/**
 * 得到最小扩容量
 */
private void ensureCapacityInternal(int minCapacity) 
    ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));

方法内调用了 ensureExplicitCapacity() 方法,参数是 calculateCapacity(elementData, minCapacity)
先来分析一下这个参数的结果是什么,聚焦到 calculateCapacity() 方法中去

2.3、calculateCapacity()
/**
 * 计算最小扩容量(被调用)
 */
private static int calculateCapacity(Object[] elementData, int minCapacity) 
     // 如果元素数组为默认的空
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) 
        // 获取“默认的容量”和“传入参数 minCapacity ”两者之间的最大值
        return Math.max(DEFAULT_CAPACITY, minCapacity);
    
    return minCapacity;

也很简单,就是为了计算出一个最小扩容量,当元素为初次初始化时,数组还没进过扩容,是一个空数组,所以会走 if 这个判断,而且当时传入的 size + 1 也就是 minCapacity 的值为 0 + 1 = 1 ,经过一个取大值的操作,与默认的 DEFAULT_CAPACITY 进行比对,自然返回的就是 10。

如果数组已经不是为空了,就直接返回一个 minCapacity (size + 1)就可以了

2.4、ensureExplicitCapacity

ensureCapacityInternal 方法内调用了 ensureExplicitCapacity(参数已经计算出来了) 方法
继续去看它

/**
 * 判断是否需要扩容
 */
private void ensureExplicitCapacity(int minCapacity) 
    modCount++;
    // overflow-conscious code
    // 如果最小容量比数组的长度还大
    if (minCapacity - elementData.length > 0)
        // 就调用grow方法进行扩容
        grow(minCapacity);

此方法的核心就是 if 判断这个数组需不需要扩容,可以分为三种情况

  • add 第 1 个元素时:此时数组还只是一个被初始化过的空数组,minCapacity 经过 calculateCapacity 计算会返回 DEFAULT_CAPACITY 的默认值 10,而 elementData.length 也自然是 0,所以 minCapacity - elementData.length > 0 是成立的,直接进入 grow(minCapacity); 开始扩容。

  • add 第 2 到 10 个元素的时候(以 2 举例):此时 minCapacity = size + 1 = 1 + 1 = 2 ,而 elementData.length 已经在添加第 1 个元素后等于 10 了。所以 minCapacity - elementData.length > 0 就不成立了,所以不会进入 grow(minCapacity); ,也不会扩容

    • 添加第 3 … 10 个元素的时候,都是一样的。
  • add 第 11 个元素的时候,minCapacity 变成了 11,比 10 还要大,所以又一次进去扩容了

2.5、grow()

真正的扩容逻辑的代码

/**
 * 要分配的最大数组大小
 */
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

/**
 * ArrayList 扩容的核心方法
 */
private void grow(int minCapacity) 
    // 将当前元素数组长度定义为 oldCapacity 旧容量
    int oldCapacity = elementData.length;
    // 新容量更新为旧容量的1.5倍
    // oldCapacity >> 1 为按位右移一位,相当于 oldCapacity 除以2的1次幂
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    // 然后检查新容量是否大于最小需要容量,若还小,就把最小需要容量当作数组的新容量
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    // 再检查新容量是否超出了ArrayList 所定义的最大容量
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        // 若超出,则调用hugeCapacity()
        newCapacity = hugeCapacity(minCapacity);
    elementData = Arrays.copyOf(elementData, newCapacity);

扩容的核心就是这句:int newCapacity = oldCapacity + (oldCapacity >> 1);

本质就是扩容 1.5 倍,而且其中使用了移位运算,这里从计算的角度上来看,相当于 oldCapacity 除以 2 的 1 次幂(偶数除以 2 刚好除尽,奇数丢掉小数部分)。使用按位右移,效率会高很多。

扩容后,需要对这个新容量的范围进行一个判断,不能小于最小需要容量,也不能大于定义的最大容量,分情况细细看一下(以 1 和 11 举例,是因为这两种都是刚好需要扩容的)

  • add 第 1 个元素的时候,数组还为空,所以无论是 oldCapacity 还是 newCapacity 都是 0,经过第一次判断后,newCapacity = minCapacity 执行了,此时 newCapacity 为 10,第二个判断不会进入,它不可能大于数组的最大容量。

  • add 第 11 个元素的时候,oldCapacity 为 10,newCapacity = 10 + 10/2 = 15,大于 minCapacity = 11,第一个判断不会进入,同时它肯定也没有大于数组最大 size,不会进入 。数组容量此时就扩为 15,add 方法中会返回一个 true,size 也增加成 11。

  • 后面都是同样的道理 …

2.5、hugeCapacity()

这个方法就是在 newCapacity 大于 MAX_ARRAY_SIZE 的时候,开始判断 minCapacity 和 MAX_ARRAY_SIZE 谁大,然后赋予不同的值。

/**
 * 比较minCapacity和 MAX_ARRAY_SIZE
 */
private static int hugeCapacity(int minCapacity) 
    if (minCapacity < 0) // overflow
        throw new OutOfMemoryError();
    return (minCapacity > MAX_ARRAY_SIZE) ?
        Integer.MAX_VALUE :
    MAX_ARRAY_SIZE;

以上是关于ArrayList扩容机制的主要内容,如果未能解决你的问题,请参考以下文章

ArrayList源码解析自动扩容机制与add操作

ArrayList扩容机制

ArrayList扩容机制

Java List 扩容机制探究(ArrayList VectorLinkedList)

ArrayList扩容机制

转ArrayList扩容机制(基于jdk1.8)