Java集合遍历性能

Posted 我的博客

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java集合遍历性能相关的知识,希望对你有一定的参考价值。

数据在内存中主要有两种存储方式:

  1.顺序存储,Random Access(Direct Access)

    这种方式,相邻的数据元素存放于相邻的内存地址中,整块内存地址是连续的,可以根据元素的位置直接计算出内存地址,直接进行读取。读取一个特定位置元素的平均时间复杂度为O(1)。正常来说,只有基于数组实现的集合,才有这种特性。Java中以ArrayList为代表。

  2.链式存储,Sequential Access:

    这种方式,每一个数据元素,在内存中都不要求处于相邻的位置,每个数据元素包含他的下一个元素的内存地址,不可以根据元素的位置直接计算出内存地址,只能按照顺序读取元素。读取一个特定位置元素的平均时间复杂度为O(n)。主要是以链表为代表。Java中以LinkedList为代表。

遍历方式主要有

  1.传统的for循环遍历,基于计数器的:

    遍历者自己在集合外部维护一个计数器,然后依次读取每一个位置的元素,当读取到一最后一个元素后,停止。主要是需要按元素的位置来读取。这也是最原始的集合遍历方法。 

for (int i = 0; i < list.size(); i++) {
    list.get(i);
}

 

  2.迭代器遍历,Iterator:

    Iterator本来是OO的一个设计模式,主要目的是屏蔽不同数据集合的特点,统一遍历集合的接口。Java作为一个OO语言,自然也在Collections中支持了Iterator模式。相比于传统for循环,Iterator取缔了显式的遍历计数器。所以基于存储集合的Iterator可以直接按位置访问数据。而基于链式存储集合的Iterator,正常的实现,都是需要保持当前遍历的位置。然后根据当前位置来向前或者向后移动指针。

Iterator iterator = list.iterator();
while (iterator.hasNext()) {
    iterator.next();
}

 

  3.foreach 循环遍历:

    屏蔽了显式声明的Iterator和计数器。内部也是采用了Iterator的方式实现,只不过Java编译器帮我们生成了这些代码

 

    优点:代码简洁,不易出错。

    缺点:只能做简单的遍历,不能在遍历过程中(删除、替换)数据集合。

for (Object object : list) { 
    System.out.println(object); 
}

 性能如何呢?

  1.传统的for循环遍历,基于计数器的:

    因为是基于元素的位置,按照位置读取,所以我们知道,对于顺序存储,因为读取特定位置元素的平均时间复杂度是O(1),所以遍历整个集合的平均时间复杂度为O(n)。而对于链式存储,因为读取特定位置元素的平均时间复杂度是O(n),所以遍历整个集合的平均时间复杂度为O(n2)(n的平方)。

    LinkedList每次都需要从第0个元素向后读取。其实他的内部做了小小的优化:查询在链表的前半部分,从链表头开始查找,查询位置在链表后半部分,从链表尾开始查找。 

各遍历方式的适用于什么场合?

  1.传统的for循环遍历,基于计数器的:

    顺序存储:读取性能比较高。适用于遍历顺序存储集合。

    链式存储:时间复杂度太大,不适合遍历链式存储的集合。

  2.迭代器遍历,Iterator:

    顺序存储:如果不是太在意时间,推荐选择此方式,毕竟代码更加简洁,也防止了Off-By-One的问题。

    链式存储:意义就重大了,平均时间复杂度降为O(n),还是挺诱人的,所以推荐这种方式遍历。

  3.foreach循环遍历:

    foreach只是让代码更加简洁了,但是他有一些缺点,就是遍历过程中,不能操作数据集合(删除等),所以有些场合不适用,而且它本身就是基于Iterator实现的,但是由于类型住转换委托,所以会比直接使用Iterator慢一点,但是还好,时间复杂度都是一样的。

以上是关于Java集合遍历性能的主要内容,如果未能解决你的问题,请参考以下文章

Day781.Stream如何提高遍历集合效率 -Java 性能调优实战

Java Map各遍历方式的性能比较

java foreach是不是能对jsonarray进行遍历

201621123057 《Java程序设计》第9周学习总结

201621123037 《Java程序设计》第9周学习总结

.NET性能优化-快速遍历List集合