此次内容和大家分享JVM中关于垃圾回收(Garbage Collect)的相关知识。
一、如何确定一个对象是垃圾?
要想进行垃圾回收,得先知道什么样的对象是垃圾。
1.1 引用计数法
对于某个对象而言,只要应用程序中持有该对象的引用,就说明该对象不是垃圾,如果一个对象没有任何指针对其引用,它就是垃圾。
注意: 如果A、B两个对象互相持有引用,会导致永远不能被回收。
1.2 可达性分析
通过GC Root的对象,可以开始向下寻找,看某个对象是否可达。 可以作为GC Root:类加载器、Thread、虚拟机栈的本地变量表、静态成员、常量引用、本地方法栈的变量等。
二、垃圾回收算法
2.1 标记-清除(Mark-Sweep)
标记(Mark)
找出内存中需要回收的对象,并把它们标记出来。此时堆中所有的对象都会被扫描一遍,从而才能确定需要回收的对象,比较耗时。
清除(Sweep)
清除掉被标记需要回收的对象,释放出对应的内存空间。
不足
1、标记和清除两个过程都比较耗时,效率不高
2、会产生大量的不连续的内存碎片,空间碎片太多可能会导致在以后程序运行的过程中需要分配较大的对象时,无法找到足够的连续内存而不得不提前触发一次垃圾回收动作。
2.2 复制(Copying)
将内存划分为两块相等的区域,每次只使用其中一块,如下图
当其中一块内存使用完了,就将还存活的对象复制到另一块上面,然后把已经使用过的内存空间一次清除掉。
不足
空间利用率降低。
2.3 标记-整理(Mark-Compact)
标记的过程仍然与“标记-清除”的算法一样,但是后续的步骤不是直接对回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。
让所有存活的对象都向一端移动,清掉边界外的内存。
三、分代收集算法
上面介绍了三种垃圾回收算法,那么在堆内存中到底用哪一种呢?
1.Yonug区:复制算法(对象被分配之后,可能生命周期比较短,此区的复制效率比较高)
2、Old区:标记清除或标记整理(Old区对象存活时间比较长,复制来复制去没必要,不如做个标记再清理)
四、 垃圾收集器
4.1 Serial收集器
在JDK1.3.1之前,曾经是虚拟机新生代收集的唯一选择,它是最基本、发展历史最悠久的收集器。
它是一种单线程收集器,不仅仅意味着它只会使用一个CPU或者一条收集线程去完成垃圾收集工作,更重要的是其在进行收集的同时需要暂停其它线程。
优点:简单高效,拥有很高的单线程收集效率
缺点:收集过程中需要暂停其它所有的线程
算法:复制算法
使用范围:新生代
应用:client模式下的默认新生代收集器
4.2 ParNew收集器
可以把ParNew收集器当作多线程版本的Serial收集器。
优点:在多CPU下,比Serial收集器效率高
缺点:收集过程中需要暂停其它所有的线程,单CPU时比Serial效率差
算法:复制算法
使用范围:新生代
应用:运行在server模式下的虚拟机首选新生代收集器
4.3 Parallel Scavenge收集器
它是一个新生代收集器,使用复制算法,又是并行多线程收集器,看上去和ParNew一样,但是更多关注的是系统的吞吐量。
吞吐量 = 运行用户程序的时间 / (运行用户程序时间 + 垃圾收集时间)
例如:虚拟机总共运行了100m,垃圾收集用了1m,吞吐量 =(100 - 1) / 100 = 99%
吞吐量越大,则垃圾收集时间越短,则用户程序可以充分利用CPU资源,尽快完成程序的运算任务。
-XX:MaxGCPauseMillis 控制最大的垃圾收集停顿时间,
-XX:GC Time Ratio 直接设置吞吐量的大小。
4.4 Serial Old收集器
它是Serial收集器的老年代版本,也是一个单线程收集器,不同的是采用“标记-整理”的算法,运行过程和Serial收集器一样。
4.5 Parallel Old收集器
Parallel Old收集器是Parallel Scavenge收集器的老年代版本,使用“标记-整理”的算法进行垃圾回收。吞吐量优先。
4.6 CMS(Concurrent Mark Sweep)收集器
CMS收集器是一种以获取最短回收停顿时间为目标的收集器。采用“标记-清除”算法,整个过程分为4步:
1、初始标记(CMS initial mark),标记GC Roots能关联到的对象,Stop The World-->速度很快
2、并发标记(CMS ConCurrent mark),进行GC Roots Tracing
3、重新标记(CMS remark),修改并发标记因用户程序变动的内容,Stop The World
4、并发清除(CMS Concurrent Sweep)
由于整个过程,并发标记和并发清除,收集器线程可以和用户线程一起工作,所以总体上来说,CMS收集器的内存回收过程是和用户线程一起并发执行的。
优点:并发收集、低停顿
缺点:产生大量空间碎片,并发阶段会降低吞吐量
4.7 G1收集器
使用G1收集器时,Java堆的内存布局与其它收集器的差别很大,它将整个Java堆划分为多个大小相等的独立区域(Region),虽然还保留有新生代和老年代的概念,但新生代和老年代不再是物理隔离了,它们都是一部分Region(不需要连续)的集合。整体上属于“标记-整理”算法,不会到处连续的空间碎片,可预测的停顿(比CMS更先进的地方在于能够让使用者明确指定一个长度为m毫秒的时间片段内,消耗在垃圾收集上的时间不得超过m毫秒)。整个过程分为4部分:
1、初始标记(Initial Marking),标记一下GC Roots能够关联的对象,并且修改TAMS(top at mark start)的值,需要暂停用户线程
2、并发标记(Concurrent Marking),从GC Roots进行可达性分析,找出存活的对象,与用户线程并发执行
3、最终标记(Final Marking),修正在并发标记阶段因为用户程序的并发执行导致变动的数据,需暂停用户线程
4、筛选回收(Live Data Counting And Evacuation),对各个Region的回收价值和成本进行排序,根据用户所期望的GC停顿时间制定回收计划。
4.8 垃圾收集器分类
-
串行收集器
Serial、Old Serial
只有一个垃圾回收线程执行,用户线程暂停。
适用于内存比较小的嵌入式设备。
-
并行收集
Parallel Scanvenge、Parallel Old
多条垃圾收集器线程并行工作,但此时用户线程仍然处于等待状态。
适用于科学计算、后台处理等若干交互场景。
吞吐量优先
-
并发收集器
CMS、G1
用户线程和垃圾收集器线程同时执行(但不一定是并行,可能是交替执行),垃圾收集线程在执行的时候不会停顿用户线程的运行。
适用于相对时间有要求的场景,比如Web
停顿时间优先
4.9 如何选择合适的垃圾收集器
- 优先调整堆的大小让服务器自己来选择
- 如果内存小于100M,使用串行收集器
- 如果是CPU单核,并且没有停顿时间的要求,使用串行或者JVM自行选择
- 如果允许停顿时间超过1S,选择并行或者JVM自行选择
- 如果响应时间最重要,并且不能超过1S,使用并发收集器。
- 来看看官网如何给出答案的: https://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/collectors.html#sthref28
4.10 如何开启垃圾收集器
(1)串行
-XX:+UseSerialGC
-XX:+UseSerialOldGC
(2)并行(吞吐量优先):
-XX:+UseParallelGC
-XX:+UseParallelOldGC
(3)并发收集器(响应时间优先)
-XX:+UseConcMarkSweepGC
-XX:+UseG1GC
4.11 如何理解吞吐量和停顿时间
-
吞吐量
运行用户代码时间/(运行用户代码时间+垃圾收集时间)
高吞吐量则可以高效地利用CPU时间,尽快完成程序的运算任务,主要适合在后台运算而不需要太多交互的任 务。
-
停顿时间
垃圾收集器进行垃圾回收终端应用执行响应的时间
停顿时间越短就越适合需要和用户交互的程序,良好的响应速度能提升用户体验。
4.12 在什么情况下使用G1?
JDK 7开始使用,JDK 8非常成熟,JDK 9默认的垃圾收集器,适用于新老生代。
判断是否需要使用G1收集器?
- 50%以上的堆被存活对象占用
- 对象分配和晋升的速度变化非常大
- 垃圾回收时间比较长