递归迭代和分治：迭代器原理

Posted 2021-08-27 纵横千里，捭阖四方

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了递归迭代和分治：迭代器原理相关的知识，希望对你有一定的参考价值。

讨论完了递归，我们再来感受一下迭代器。

1.背景

迭代器是否感觉陌生又熟悉？熟悉是因为在访问ArrayList、LinkedList、HashSet等元素时，都有一种方式叫迭代器。陌生是用循环来访问元素不香吗？为啥会有迭代器？另外就是迭代器是怎么工作的呢？迭代器模式又是什么鬼？

接下来我们就用几期来分析java中的迭代器相关的问题。这些问题在算法面试时考得并不多，但是可以加深我们对jdk集合的理解。面试时，如何证明对jdk的集合有深入的了解呢？笔者觉得比较重要的有Hash和Set家族、链表和ArrayList家族、阻塞队列家族以及遍历时的迭代器原理，如果这些都不清楚，只是会用怎么能说精通呢？

本期我们先看一下java中是如何使用迭代器的。

　迭代器就是把访问逻辑从不同类型的集合类中抽取出来，从而避免向外部暴露集合的内部结构。

Java集合框架的集合类，我们有时候称之为容器。容器的种类有很多种，比如ArrayList、LinkedList、HashSet...，每种容器都有自己的特点，ArrayList底层维护的是一个数组；LinkedList是链表结构的；HashSet依赖的是哈希表，每种容器都有自己特有的数据结构。我们学习Spring时经常听到web容器和Spring容器，其核心就是将初始化的bean放在一个ConcurrentHashMap里。

因为容器的内部结构不同，很多时候可能不知道该怎样去遍历一个容器中的元素。所以为了使对容器内元素的操作更为简单，Java引入了迭代器！例如访问数组，我们可以这么写：

int array[] = new int[3];     for (int i = 0; i < array.length; i++) {     System.out.println(array[i]); }

对ArrayList的处理：

 List<String> list = new ArrayList<String>();       for(int i = 0 ; i < list.size() ;  i++){           String string = list.get(i); }

　　对于这两种方式，我们总是都知道它的内部结构，访问代码和集合本身是紧密耦合的，无法将访问逻辑从集合类和客户端代码中分离出来。不同的集合会对应不同的遍历方法，客户端代码无法复用。在实际应用中如何将上面两个集合整合是相当麻烦的。所以才有Iterator，它总是用同一种逻辑来遍历集合。使得客户端自身不需要来维护集合的内部结构，所有的内部状态都由Iterator来维护。客户端不用直接和集合进行打交道，而是控制Iterator向它发送向前向后的指令，就可以遍历集合。

2.迭代器的定义和使用

下面让我们看看Java中的Iterator接口是如何实现的。

迭代器有关的接口有两个，一个是Iterator，一个是Iterable。

　　在Java中Iterator为一个接口，路径是java.util.Iterator，它只提供了迭代的基本规则。在JDK中它是这样定义的：对Collection进行迭代的迭代器。迭代器取代了Java Collection Framework中的Enumeration。迭代器与枚举有两点不同:

　　1. 迭代器在迭代期间可以从集合中移除元素。

　　2. 方法名得到了改进，Enumeration的方法名称都比较长。

其接口定义如下:

package java.util;public interface Iterator<E> {    boolean hasNext();//判断是否存在下一个对象元素    E next();//获取下一个元素    void remove();//移除元素}

Java中还提供了一个Iterable接口，Iterable接口实现后的功能是‘返回’一个迭代器，我们常用的实现了该接口的子接口有:Collection<E>、List<E>、Set<E>等。该接口的iterator()方法返回一个标准的Iterator实现。实现Iterable接口允许对象成为Foreach语句的目标。就可以通过foreach语句来遍历你的底层序列。

　　Iterable接口包含一个能产生Iterator对象的方法，并且Iterable被foreach用来在序列中移动。因此如果创建了实现Iterable接口的类，都可以将它用于foreach中。

Iterable接口的具体实现:

Package java.lang;import java.util.Iterator;public interface Iterable<T> {    Iterator<T> iterator();}

看一个迭代器接口使用的例子：

public static void main(String[] args) {        List<String> list = new ArrayList<String>();        list.add("张三1");        list.add("张三2");        list.add("张三3");        list.add("张三4");        List<String> linkList = new LinkedList<String>();        linkList.add("link1");        linkList.add("link2");        linkList.add("link3");        linkList.add("link4");        Set<String> set = new HashSet<String>();        set.add("set1");        set.add("set2");        set.add("set3");        set.add("set4");        //使用迭代器遍历ArrayList集合        Iterator<String> listIt = list.iterator();        while(listIt.hasNext()){            System.out.println(listIt.next());        }        //使用迭代器遍历Set集合        Iterator<String> setIt = set.iterator();        while(setIt.hasNext()){            System.out.println(listIt.next());        }        //使用迭代器遍历LinkedList集合        Iterator<String> linkIt = linkList.iterator();        while(linkIt.hasNext()){            System.out.println(listIt.next());        }}

我们再看一下for循环的遍历方式：

List<String> list = new ArrayList<String>();       for(int i = 0 ; i < list.size() ;  i++){           String string = list.get(i); }

对比上面我们可以看到迭代遍历集合的优势在于代码更加的简洁，更不容易出错，不用关心下标的起始值和终止值，也不用关心怎么构造的，只需要关心当前情况下如何处理就行了。

3.Iterator遍历时不可以删除集合中的元素问题

　在使用Iterator的时候禁止对所遍历的容器进行改变其大小结构的操作。例如: 在使用Iterator进行迭代时，如果对集合进行了add、remove操作就会出现ConcurrentModificationException异常。

List<String> list = new ArrayList<String>();        list.add("张三1");        list.add("张三2");        list.add("张三3");        list.add("张三4");        //使用迭代器遍历ArrayList集合        Iterator<String> listIt = list.iterator();        while(listIt.hasNext()){            Object obj = listIt.next();            if(obj.equals("张三3")){                list.remove(obj);            }        }

因为在你迭代之前，迭代器已经被通过list.itertor()创建出来了，如果在迭代的过程中，又对list进行了改变其容器大小的操作，那么Java就会给出异常。因为此时Iterator对象已经无法主动同步list做出的改变，Java会认为你做出这样的操作是线程不安全的，就会给出善意的提醒（抛出ConcurrentModificationException异常）。下面我们看一下实现代码里如何做的：

这个Itr是很多数据结构的内部类，下面这个是ArrayList中实现的内部类　

private class Itr implements Iterator<E> {        int cursor;       // index of next element to return        int lastRet = -1; // index of last element returned; -1 if no such        int expectedModCount = modCount;        public boolean hasNext() {            return cursor != size;        }        @SuppressWarnings("unchecked")        public E next() {            checkForComodification();            int i = cursor;            if (i >= size)                throw new NoSuchElementException();            Object[] elementData = ArrayList.this.elementData;            if (i >= elementData.length)                throw new ConcurrentModificationException();            cursor = i + 1;            return (E) elementData[lastRet = i];        }        public void remove() {            if (lastRet < 0)                throw new IllegalStateException();            checkForComodification();            try {                ArrayList.this.remove(lastRet);                cursor = lastRet;                lastRet = -1;                expectedModCount = modCount;            } catch (IndexOutOfBoundsException ex) {                throw new ConcurrentModificationException();            }        }//此处跳过了forEachRemaining方法        final void checkForComodification() {            if (modCount != expectedModCount)                throw new ConcurrentModificationException();        }    }

通过查看源码发现原来检查并抛出异常的是checkForComodification()方法。在ArrayList中modCount是当前集合的版本号，每次修改(这里主要是删，没有找到添加的方法)集合都会加1；expectedModCount是当前迭代器的版本号，在迭代器实例化时初始化为modCount。

我们看到在checkForComodification()方法中就是在验证modCount的值和expectedModCount的值是否相等，所以当你在调用了ArrayList.add()或者ArrayList.remove()时，只更新了modCount的状态，而迭代器中的expectedModCount未同步，因此才会导致再次调用Iterator.next()方法时抛出异常。但是为什么使用Iterator.remove()就没有问题呢？通过源码的第32行发现，在Iterator的remove()中同步了expectedModCount的值，所以当你下次再调用next()的时候，检查不会抛出异常。

　　使用该机制的主要目的是为了实现ArrayList中的快速失败机制（fail-fast），在Java集合中较大一部分集合是存在快速失败机制的。

　　快速失败机制产生的条件:当多个线程对Collection进行操作时，若其中某一个线程通过Iterator遍历集合时，该集合的内容被其他线程所改变，则会抛出ConcurrentModificationException异常。

　　所以要保证在使用Iterator遍历集合的时候不出错误，就应该保证在遍历集合的过程中不会对集合产生结构上的修改。

4.补充一点：foreach的底层也是迭代器

foreach也是我们经常使用的遍历方法。foreach的出现是为了简化我们遍历集合的行为，例如：

  for (String string : list) {            System.out.println(string);  }

那foreach底层是怎么实现的呢?也是迭代器。

实现了Iterable接口的类就可以通过Foreach遍历，那是因为foreach要依赖于Iterable接口返回的Iterator对象，所以从本质上来讲，Foreach其实就是在使用迭代器，在使用foreach遍历时对集合的结构进行修改，和在使用Iterator遍历时对集合结构进行修改本质上是一样的。所以同样的也会抛出异常，执行快速失败机制。

以上是关于递归迭代和分治：迭代器原理的主要内容，如果未能解决你的问题，请参考以下文章