Java集合遍历性能
Posted 我的博客
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java集合遍历性能相关的知识,希望对你有一定的参考价值。
数据在内存中主要有两种存储方式:
1.顺序存储,Random Access(Direct Access)
这种方式,相邻的数据元素存放于相邻的内存地址中,整块内存地址是连续的,可以根据元素的位置直接计算出内存地址,直接进行读取。读取一个特定位置元素的平均时间复杂度为O(1)。正常来说,只有基于数组实现的集合,才有这种特性。Java中以ArrayList为代表。
2.链式存储,Sequential Access:
这种方式,每一个数据元素,在内存中都不要求处于相邻的位置,每个数据元素包含他的下一个元素的内存地址,不可以根据元素的位置直接计算出内存地址,只能按照顺序读取元素。读取一个特定位置元素的平均时间复杂度为O(n)。主要是以链表为代表。Java中以LinkedList为代表。
遍历方式主要有
1.传统的for循环遍历,基于计数器的:
遍历者自己在集合外部维护一个计数器,然后依次读取每一个位置的元素,当读取到一最后一个元素后,停止。主要是需要按元素的位置来读取。这也是最原始的集合遍历方法。
for (int i = 0; i < list.size(); i++) { list.get(i); }
2.迭代器遍历,Iterator:
Iterator本来是OO的一个设计模式,主要目的是屏蔽不同数据集合的特点,统一遍历集合的接口。Java作为一个OO语言,自然也在Collections中支持了Iterator模式。相比于传统for循环,Iterator取缔了显式的遍历计数器。所以基于存储集合的Iterator可以直接按位置访问数据。而基于链式存储集合的Iterator,正常的实现,都是需要保持当前遍历的位置。然后根据当前位置来向前或者向后移动指针。
Iterator iterator = list.iterator(); while (iterator.hasNext()) { iterator.next(); }
3.foreach 循环遍历:
屏蔽了显式声明的Iterator和计数器。内部也是采用了Iterator的方式实现,只不过Java编译器帮我们生成了这些代码
优点:代码简洁,不易出错。
缺点:只能做简单的遍历,不能在遍历过程中(删除、替换)数据集合。
for (Object object : list) { System.out.println(object); }
性能如何呢?
1.传统的for循环遍历,基于计数器的:
因为是基于元素的位置,按照位置读取,所以我们知道,对于顺序存储,因为读取特定位置元素的平均时间复杂度是O(1),所以遍历整个集合的平均时间复杂度为O(n)。而对于链式存储,因为读取特定位置元素的平均时间复杂度是O(n),所以遍历整个集合的平均时间复杂度为O(n2)(n的平方)。
LinkedList每次都需要从第0个元素向后读取。其实他的内部做了小小的优化:查询在链表的前半部分,从链表头开始查找,查询位置在链表后半部分,从链表尾开始查找。
各遍历方式的适用于什么场合?
1.传统的for循环遍历,基于计数器的:
顺序存储:读取性能比较高。适用于遍历顺序存储集合。
链式存储:时间复杂度太大,不适合遍历链式存储的集合。
2.迭代器遍历,Iterator:
顺序存储:如果不是太在意时间,推荐选择此方式,毕竟代码更加简洁,也防止了Off-By-One的问题。
链式存储:意义就重大了,平均时间复杂度降为O(n),还是挺诱人的,所以推荐这种方式遍历。
3.foreach循环遍历:
foreach只是让代码更加简洁了,但是他有一些缺点,就是遍历过程中,不能操作数据集合(删除等),所以有些场合不适用,而且它本身就是基于Iterator实现的,但是由于类型住转换委托,所以会比直接使用Iterator慢一点,但是还好,时间复杂度都是一样的。
以上是关于Java集合遍历性能的主要内容,如果未能解决你的问题,请参考以下文章
Day781.Stream如何提高遍历集合效率 -Java 性能调优实战
java foreach是不是能对jsonarray进行遍历
201621123057 《Java程序设计》第9周学习总结