ArrayList

概述

ArrayList 是长度可变的 List 接口实现，它会随着 List 中的元素增加而扩大 List 的长度。ArrayList，顾名思义，它是利用 Array 构造的 List。但 Java 中的 Array 是定长的，那么 ArrayList 是如何支持长度可变的特性呢？实际上这里并没有黑科技：ArrayList 内部会保存一个定长 Array 来存储 ArrayList 中的元素，每当当前定长的 Array 放满，就重新申请一个更长的 Array，把当前的 Array 里的元素全部拷贝进去。

说明

为了避免混淆，Array 和 List 在本文中不作翻译，保留原单词
capacity => 容量
size => 长度
reallocation => 重分配
本文应用范围 - Java8

导读

instance variables

public class ArrayList<E> extends AbstractList<E> 
    implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{
    transient Object[] elementData;
    private int size;

    //...
}

ArrayList 只有两个 instance variable，其中

elementData 用来保存元素
size 用来记录 ArrayList 的长度/大小。

constructors

constructor without parameters

写代码时，十有八九我们会这样声明一个 ArrayList

List<Object> list = new ArrayList<>();

在它的背后 ArrayList 做了哪些事情呢？

private static final int DEFAULT_CAPACITY = 10;
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

public ArrayList() { this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA; }

每次初始化一个空的 ArrayList 实例，elementData 都指向 DEFAULTCAPACITY_EMPTY_ELEMENTDATA，后者是一个以单例形式存在的空的 Object Array。由于现实的应用中充斥着空的、从未增加元素的 ArrayList，如果为这些空的 ArrayList 都分配内存空间，将造成不可忽视的空间浪费，而这里正是用单例代替预分配的策略来避免无谓的浪费。

constructor with initialCapacity

如果我们预先知道 list 的容量 (capacity)，就可以在初始化的时候设定容量大小：

private static final Object[] EMPTY_ELEMENTDATA = {};

public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
        this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
        this.elementData = EMPTY_ELEMENTDATA;
    } else {
        throw new IllegalArgumentException("Illegal Capacity: "+
                                           initialCapacity);
    }
}

同样，这里的 EMPTY_ELEMENTDATA 也是用作避免空间浪费。

这里需要区分一下容量和长度：容量指的是 ArrayList 在不做重分配的情况下，最多能容纳的元素数量；长度指的是 ArrayList 当前的元素数量。因此执行如下代码会抛错：

ArrayList<Integer> arr = new ArrayList<Integer>(20);
arr.add(5, 10); // 当前 ArrayList 的容量为 20，长度为 0，无法直接将 10 插入到第 5 个位置

constructor with Collection

public ArrayList(Collection<? extends E> c) {
    elementData = c.toArray();
    if ((size = elementData.length) != 0) {
        // c.toArray might (incorrectly) not return Object[] (see 6260652)
        if (elementData.getClass() != Object[].class)
            elementData = Arrays.copyOf(elementData, size, Object[].class);
    } else {
        // replace with empty array.
        this.elementData = EMPTY_ELEMENTDATA;
    }
}

如果没有 bug 6260652，本段代码实际可以精简成：

public ArrayList(Collection<? extends E> c) {
    elementData = c.toArray();
    if (elementData.length == 0) {
        elementData = EMPTY_ELEMENTDATA;
    }
}

一目了然，c.toArray() 是 Collection 到 Array 的转化 api，如果长度为 0，则初始化为 EMPTY_ELEMENTDATA。

增长策略

private static final int DEFAULT_CAPACITY = 10;

public boolean add(E e) {
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    elementData[size++] = e;
    return true;
}

private static int calculateCapacity(Object[] elementData, int minCapacity) {
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        return Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    return minCapacity;
}

private void ensureCapacityInternal(int minCapacity) {
    ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}

private void ensureExplicitCapacity(int minCapacity) {
    modCount++;

    // overflow-conscious code
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);
}

往 ArrayList 里添加元素前，需要先检查容量是否满足需求，若不足则应该扩容。这里的 calculateCapacity 保证了：如果是默认初始容量的 ArrayList，就直接将最小容量设置为 DEFAULT_CAPACITY => 10。最后，在 ensureExplicitCapacity 中判断：若所需最小容量大于当前 elementData 的长度，就应该扩容，见下文中的 grow 函数：

private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

private void grow(int minCapacity) {
    // overflow-conscious code
    int oldCapacity = elementData.length;
    // oldCapacity >> 1 相当于 oldCapacity * 0.5
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // minCapacity is usually close to size, so this is a win:
    elementData = Arrays.copyOf(elementData, newCapacity);
}

private static int hugeCapacity(int minCapacity) {
    // 令人费解的代码
    if (minCapacity < 0) // overflow
        throw new OutOfMemoryError();

    return (minCapacity > MAX_ARRAY_SIZE) ?
        Integer.MAX_VALUE :
        MAX_ARRAY_SIZE;
}

扩容策略的复杂度分析

扩容的主要策略就是 int newCapacity = oldCapacity + (oldCapacity >> 1) 即 int newCapacity = 1.5 * oldCapacity ，这种扩容方式可以将插入操作的均摊 (amortized) 时间、空间复杂度控制在 O(n) 内，具体计算过程见这里。实际上，只要每次扩容的系数大于 1，就可以获得均摊复杂度为 O(n) 插入性能。一般教材中，扩容系数常常以 2 为例，这里使用 1.5 主要是考虑到现实应用中的几个特点：

系数太大可能导致分配过多
系数太小可能导致分配太频繁
1.5 比较好计算 (oldCapacity >> 1)

OutOfMemoryError

hugeCapacity 中存在一段令人费解的代码: 为什么 minCapacity 会小于 0 呢？只看目前的代码，确实无法看出原因，我们看另外一段代码：

public boolean addAll(Collection<? extends E> c) {
    Object[] a = c.toArray();
    int numNew = a.length;
    ensureCapacityInternal(size + numNew);  // Increments modCount
    System.arraycopy(a, 0, elementData, size, numNew);
    size += numNew;
    return numNew != 0;
}

这里 size + numNew 得到的 minCapacity 就可能出现溢出而产生负数，如：

public static void main(String[] args) {
    int minInteger = Integer.MIN_VALUE;
    int maxInteger = Integer.MAX_VALUE;

    System.out.println(minInteger - 1); // 2147483647
    System.out.println(maxInteger + 1); // -2147483648
}

具体可以参考这篇文章。

性能分析

插入 (add)

时间复杂度及空间复杂度在均摊情况下都为 O(n)，具体请回顾增长则略部分讲解。

随机访问 (get)

E elementData(int index) {
    return (E) elementData[index];
}

private void rangeCheck(int index) {
    if (index >= size)
        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

public E get(int index) {
    rangeCheck(inex);    
    return elementData(index);
}

由于 ArrayList 的底层是 Object[]，因此随机访问的时间复杂度为 O(1)，没有使用额外的空间。

查询元素位置 (indexOf)

public int indexOf(Object o) {
    if (o == null) {
        for (int i = 0; i < size; i++)
            if (elementData[i]==null)
                return i;
    } else {
        for (int i = 0; i < size; i++)
            if (o.equals(elementData[i]))
                return i;
    }
    return -1;
}

public int lastIndexOf(Object o) {
    if (o == null) {
        for (int i = size-1; i >= 0; i--)
            if (elementData[i]==null)
                return i;
    } else {
        for (int i = size-1; i >= 0; i--)
            if (o.equals(elementData[i]))
                return i;
    }
    return -1;
}

遍历 elementData，因此查询任意元素位置的时间复杂度为 O(1)，没有使用额外的空间。同时需要注意：

查询停止于第一个符合条件的元素
支持查询 null 元素
不存在查询元素返回 -1

删除指定位置的元素 (remove)

public E remove(int index) {
    rangeCheck(index);

    modCount++;
    E oldValue = elementData(index);

    int numMoved = size - index - 1;
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index,
                         numMoved);
    elementData[--size] = null; // clear to let GC do its work

    return oldValue;
}

由于删除某个元素需要移动它后面的所有元素，因此删除指定位置元素的时间复杂度为 O(n)，由于 System.arraycopy 在执行过程中，如果 src (elementData), dest (elementData) 指向同一个 Array，那么复制过程中会使用临时空间存储 src Array，因此空间复杂度也为 O(n)。

值得注意的是，elementData[--size] = null 将 elementData 外的元素的指针移除，否则 elementData[size] 在整个 ArrayList 被回收之前，都会保留对相应对象的指针，使得该对象无法被回收。

ArrayList

ArrayList

概述

说明

导读

instance variables

constructors

constructor without parameters

constructor with initialCapacity

constructor with Collection

增长策略

扩容策略的复杂度分析

OutOfMemoryError

性能分析

插入 (add)

随机访问 (get)

查询元素位置 (indexOf)

删除指定位置的元素 (remove)

FAQ

results matching ""

No results matching ""