[java学习]java容器源码初探

Posted 2020-06-23 KesarChen

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了[java学习]java容器源码初探相关的知识，希望对你有一定的参考价值。

一、动态数组ArrayList

在我们开发者眼中，这就是一个“动态数组”，可以“动态”地调整数组的大小，虽然说数组从定义了长度后，就不能改变大小。
实现“动态”调整的基本原理就是：按照某个调整策略，重新创建一个调整后一样大小的数组，然后将原来的数组赋值回去。
下面我们来解析一下几个与数组不一样的方法。

看看ArrayList中主要的几个字段（源码剖析）：

    // 默认的初始数组大小
    private static final int DEFAULT_CAPACITY = 10;

    // 空数组的表示
    private static final Object[] EMPTY_ELEMENTDATA = {};

    // 数据保存的数组，主体就是它
    private transient Object[] elementData;

    // 数组元素个数（不一定等于数组的length）
    private int size;

添加元素（源码剖析）：

public boolean add(E e) {
    // 判断数组需不需要扩容，需要就扩容（动态调整数组大小的关键方法）
    ensureCapacityInternal(size + 1);
    // 数组元素赋值，数组元素个数+1
    elementData[size++] = e;
    return true;
}

public void add(int index, E element) {
    // 监测是否是数组越界
    rangeCheckForAdd(index);
    // 判断数组需不需要扩容，需要就扩容（动态调整数组大小的关键方法）
    ensureCapacityInternal(size + 1);
    // index和index的元素向后移动
     System.arraycopy(elementData, index, elementData, index + 1, size - index);
    // index位置上赋值
    elementData[index] = element;
    // 数组元素+1
    size++;
}

删除元素，这里注意，并没有真正的缩小数组的大小，只是修改size的值（源码剖析）：

public E remove(int index) {
    // 数组越界检查，会抛出异常哦
    rangeCheck(index);
    // 记录修改次数，在迭代器那里会有用
    modCount++;
    // 找到要删除的数据
    E oldValue = elementData(index);
    // 需要移动的元素个数
    int numMoved = size - index - 1;
    if (numMoved > 0)
    // 复制数组，移动元素
    System.arraycopy(elementData, index+1, elementData, index,numMoved);
    // 移除引用，方便GC回收
    elementData[--size] = null;
    return oldValue;
}

public boolean remove(Object o) {
    if (o == null) {
        // 遍历数组，查找到第一个为null值的元素，然后删除
        for (int index = 0; index < size; index++)
            if (elementData[index] == null) {
                // 快速删除
                fastRemove(index);
                return true;
            }
    } else {
        // 同样是遍历数组，查找
        for (int index = 0; index < size; index++)
            if (o.equals(elementData[index])) {
                // 找到，删除
                fastRemove(index);
                return true;
            }
    }
    // 找不到
    return false;
}
// 与E remove(int index)的差不多，我就不多说了。
// 这里我就不明白，remove(int index)和fastRemove(int index)明明可以代码复用，为何不复用代码呢？
private void fastRemove(int index) {
    modCount++;
    int numMoved = size - index - 1;
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index, numMoved);
    // 置null，让GC可以回收它
    elementData[--size] = null;
}

看看最重要的数组扩容方法（源码剖析）：

    private void ensureCapacityInternal(int minCapacity) {
        // 判断数组是否为空数组
        if (elementData == EMPTY_ELEMENTDATA) {
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
        }
        ensureExplicitCapacity(minCapacity);
    }

    private void ensureExplicitCapacity(int minCapacity) {
        // 修改次数+1
        modCount++;
        // 判断需不需要扩容：比较数组大小和需要扩容的大小
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }

    // 增加容量开始
    private void grow(int minCapacity) {
        int oldCapacity = elementData.length;
        // x1.5倍
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)
            // 扩容的大小太小了
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            // 扩容的大小不会超过最大容量Integer.MAX_VALUE-8
            newCapacity = hugeCapacity(minCapacity);
        // 数组复制
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

ArrayList被称为“动态数组的原理”，大致就如源码解析中注释。里面还有其他数组操作的方法，这里就不多讲，其实思路也是差不多的，一切以源码为准。

二、链表队列LinkedList

（双向）链表+队列（Deque）。以前我一直以为LinkedList只是个链表而已，没想到它可以当队列用。

看看结点代码，一看就知道是双向的结点（源码）：

    private static class Node<E> {
        E item;
        Node<E> next; // 后继节点
        Node<E> prev; // 前置节点

        Node(Node<E> prev, E element, Node<E> next) {
            this.item = element;
            this.next = next;
            this.prev = prev;
        }
    }

几个重要字段（源码解析）：

    // transient：不被序列化
    // 结点个数
    transient int size = 0;
    // 第一个结点
    transient Node<E> first;
    // 最后一个结点
    transient Node<E> last;

简单的看看链表的代码（源码解析）：

    // 添加结点
    public void add(int index, E element) {
        // 检查index是否越界
        checkPositionIndex(index);
        if (index == size)
            // 添加最后一个
            linkLast(element);
        else
            // 添加到原index结点前面
            linkBefore(element, node(index));
    }
    // 删除结点
    public E remove(int index) {
        // 检查index是否越界
        checkElementIndex(index);
        // 解除结点链接
        return unlink(node(index));
    }
    // 查找结点
    public E get(int index) {
        // 检查越界了没
        checkElementIndex(index);
        // 开始查找
        return node(index).item;
    }
    // “真正”是使用这个方法来查找
    Node<E> node(int index) {
        // 折半查找~，果然是会利用双向链表的优点
        if (index < (size >> 1)) { // 从前面找找前半边
            Node<E> x = first;
            for (int i = 0; i < index; i++)
                x = x.next;
            return x;
        } else { // 从后面找找后半边
            Node<E> x = last;
            for (int i = size - 1; i > index; i--)
                x = x.prev;
            return x;
        }
    }

简单的看看队列的代码（源码解析）：

    // 入队
    public boolean offer(E e) {
        return add(e);
    }
    // 也是入队
    public boolean add(E e) {
        // 接到最后一个结点
        linkLast(e);
        // 个人觉得这个return true没必要，完全可以无返回值void，以为如果入队失败linkLast会抛异常。既然是抛异常了，就不会return false了，那就没必要return true。
        return true;
    }
    // “温柔地”取队头元素，队为空不会抛出异常，只会返回null
    public E peek() {
        final Node<E> f = first;
        return (f == null) ? null : f.item;
    }
    // “粗暴地”取队头元素，队为空抛出NoSuchElementException异常
    public E element() {
        return getFirst();
    }
    // “温柔地”出队，队为空不会抛出异常，只会返回null
    public E poll() {
        final Node<E> f = first;
        return (f == null) ? null : unlinkFirst(f);
    }
    // “粗暴地”出队，队为空抛出NoSuchElementException异常
    public E remove() {
        return removeFirst();
    }

三、安全的动态数组Vector

加锁版的ArrayList（线程安全）。方法实现与ArrayList差不多，不同的是线程不安全的方法都加上锁（synchronized）了，这里就不讲啦。
一般不使用Vector而使用ArrayList，除非在多线程环境下（万不得已）才使用Vector。

四、栈Stack

栈，父类是Vector，所以你懂的（加锁版动态数组）。既然父类“安全”了，作为子类的栈也要“安全”了（加锁！），这么说栈也不是很快嘛~。
Stack规定数组最后一个元素为栈顶元素。

入栈（源码解析）:

    // 不加锁？父类Vector的addElement已经加锁了，所以不加多余的锁。
    public E push(E item) {
        // 添加元素到数组最后一个元素的后面
        addElement(item);
        // 返回压入栈的元素
        return item;
    }

出栈（源码解析）:

    // 出栈
    public synchronized E pop() {
        E obj;
        // 栈中元素个数
        int len = size();
        // 取栈顶元素
        obj = peek();
        // 移除最后的一个元素（就是移除栈顶元素啦）
        removeElementAt(len - 1);
        // 返回移除的栈顶元素
        return obj;
    }
    // 取栈顶元素
    public synchronized E peek() {
        int len = size();
        if (len == 0)
            // 空栈异常
            throw new EmptyStackException();
            // 取数组最后一个元素
        return elementAt(len - 1);
    }

栈中元素查找，从栈顶（最后一个数组元素）到栈底（第一个数组元素）（源码解析）:

    public synchronized int search(Object o) {
        // 找到最后一个符合要求的元素
        int i = lastIndexOf(o);
        if (i >= 0) {
            // 找到了
            return size() - i;
        }
        // 没找到
        return -1;
    }

五、优先队列PriorityQueue

PriorityQueue实现了优先队列（默认最小堆）。
实现优先队列的难点：需要调整堆。
调整堆的方法有：上滤和下滤。

几个重要字段（源码解析）：

    // 默认的初始化容器大小
    private static final int DEFAULT_INITIAL_CAPACITY = 11;
    // 元素数组
    private transient Object[] queue;
    // 元素个数
    private int size = 0;
    // 比较器（可拓展），可以为空，为空的话E就必须实现Comparable接口。
    private final Comparator<? super E> comparator;
    // 修改次数
    private transient int modCount = 0;

添加元素（入队）（源码解析）：

    public boolean add(E e) {
        return offer(e);
    }

    public boolean offer(E e) {
        if (e == null)
            throw new NullPointerException();
        // 修改次数+1
        modCount++;
        int i = size;
        // 判断是否应该扩充数组
        if (i >= queue.length)
        // 数组扩容
            grow(i + 1);
        // 数组元素增加1
        size = i + 1;
        if (i == 0)
        // 第一个入队的元素
            queue[0] = e;
        else
        // 因为有元素加入，需要调整堆（从下到上）：上滤
            siftUp(i, e);
        return true;
    }

我们来看看调整堆的方法（源码解析）：

上滤（源码解析）：

    // 选择比较器上滤还是Comparable对象的上滤
    private void siftUp(int k, E x) {
        if (comparator != null)
            // 优先选择有比较器的进行上滤
            siftUpUsingComparator(k, x);
        else
            // Comparable对象的上滤
            siftUpComparable(k, x);
    }

    // Comparable对象的上滤
    private void siftUpComparable(int k, E x) {
        // 强制转换成Comparable对象，这样才能有下面的比较
        Comparable<? super E> key = (Comparable<? super E>) x;
        while (k > 0) {
            // k是子结点在数组中的下标，(k-1)/2可以求出父结点下标
            int parent = (k - 1) >>> 1;
            // 取得父结点
            Object e = queue[parent];
            // 如果key大于或等于父节点
            if (key.compareTo((E) e) >= 0)
                break;
            // key小于父结点
            // 父结点与子结点交换值
            queue[k] = e;
            // k跑到父结点的位置
            k = parent;
        }
        // 赋值到合适位置
        queue[k] = key;
    }
    // 使用比较器的上滤（解析和siftUpComparable一样）
    private void siftUpUsingComparator(int k, E x) {
        while (k > 0) {
            int parent = (k - 1) >>> 1;
            Object e = queue[parent];
            if (comparator.compare(x, (E) e) >= 0)
                break;
            queue[k] = e;
            k = parent;
        }
        queue[k] = x;
    }

下滤（源码解析）：

   // 下滤（和上滤一样有两次方式）
   private void siftDown(int k, E x) {
        if (comparator != null)
            siftDownUsingComparator(k, x);
        else
            siftDownComparable(k, x);
    }
    // Comparable对象的下滤
    private void siftDownComparable(int k, E x) {
        Comparable<? super E> key = (Comparable<? super E>)x;
        // 计算出非叶子结点个数
        int half = size >>> 1;
        while (k < half) {
            // 计算出左孩子的位置
            int child = (k << 1) + 1;
            // 取得左孩子的对象
            Object c = queue[child];
            // 右孩子的位置
            int right = child + 1;
            // 如果右孩子存在，并且左孩子大于右孩子
            if (right < size &&
                ((Comparable<? super E>) c).compareTo((E) queue[right]) > 0)
                // 选择右孩子作为与父结点的比较对象
                c = queue[child = right];
            // 父子结点比较
            if (key.compareTo((E) c) <= 0)
                // 如果父节点小于或等于子结点，则找到要调整的位置
                break;
            // 子结点值赋值到父结点
            queue[k] = c;
            // 换子结点进入下次循环的比较
            k = child;
        }
        // 找到调整的位置，赋值
        queue[k] = key;
    }
    // 使用比较器的下滤（解析和siftDownComparable一样）
    private void siftDownUsingComparator(int k, E x) {
        int half = size >>> 1;
        while (k < half) {
            int child = (k << 1) + 1;
            Object c = queue[child];
            int right = child + 1;
            if (right < size &&
                comparator.compare((E) c, (E) queue[right]) > 0)
                c = queue[child = right];
            if (comparator.compare(x, (E) c) <= 0)
                break;
            queue[k] = c;
            k = child;
        }
        queue[k] = x;
    }

总结：阅读一下java容器包中的类后，对数据结构的了解又加深了一层，确实源码里的都是“好东西”。这里的讲的类还不全面，未完持续！

以上是关于[java学习]java容器源码初探的主要内容，如果未能解决你的问题，请参考以下文章