G1 垃圾收集器深入剖析(图文超详解)
Posted mikechen的互联网架构
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了G1 垃圾收集器深入剖析(图文超详解)相关的知识,希望对你有一定的参考价值。
G1(Garbage First)垃圾收集器是目前垃圾回收技术最前沿的成果之一。
G1 同 CMS 垃圾回收器一样,关注最小时延的垃圾回收器,适合大尺寸堆内存的垃圾收集。
G1 最大的特点是引入分区的思路,弱化了分代的概念,合理利用垃圾收集各个周期的资源,解决了其他收集及 CMS 的很多缺陷。
官方推荐使用 G1 来代替 CMS。
我们本篇重点了解 G1 收集器:
1. G1 概述
2. G1 堆内存
3. G1 回收流程
4. G1 GC 模式
5. G1 推荐用例
目录
G1 收集器概述
HotSpot 团队一直努力朝着高效收集、减少停顿 (STW: Stop The World) 的方向努力,贡献了从串行 Serial 收集器、到并行收集器 Parallerl 收集器,再到 CMS 并发收集器,乃至如今的 G1 在内的一系列优秀的垃圾收集器。
G1(Garbage First) 垃圾收集器,是关注最小时延的垃圾回收器,也同样适合大尺寸堆内存的垃圾收集,官方推荐选择使用 G1 来替代 CMS 。
1. G1 收集器的最大特点
- G1最大的特点是引入分区的思路,弱化了分代的概念。
- 合理利用垃圾收集各个周期的资源,解决了其他收集器、甚至 CMS 的众多缺陷。
2. G1 的改进(相比较 CMS )
- 算法: G1 基于标记--整理算法, 不会产生空间碎片,在分配大对象时,不会因无法得到连续的空间,而提前触发一次 FULL GC 。
- 停顿时间可控: G1可以通过设置预期停顿时间(Pause Time)来控制垃圾收集时间避免应用雪崩现象。
- 并行与并发:G1 能更充分的利用 CPU 多核环境下的硬件优势,来缩短 stop the world 的停顿时间。
3. CMS 和 G1 的区别
- CMS 中,堆被分为 PermGen,YoungGen,OldGen ;而 YoungGen 又分了两个 survivo 区域。在 G1 中,堆被平均分成几个区域 (region) ,在每个区域中,虽然也保留了新老代的概念,但是收集器是以整个区域为单位收集的。
- G1 在回收内存后,会立即同时做合并空闲内存的工作;而 CMS ,则默认是在 STW(stop the world)的时候做。
- G1 会在 Young GC 中使用;而 CMS 只能在 O 区使用。
4. G1 收集器的应用场景
目前,CMS 还是默认首选的 GC 策略。
G1 垃圾收集算法,主要应用在多 CPU 大内存的服务中,在满足高吞吐量的同时,尽可能的满足垃圾回收时的暂停时间。
在以下场景中,G1 更适合:
- 服务端多核 CPU、JVM 内存占用较大的应用(至少大于4G);
- 应用在运行过程中,会产生大量内存碎片、需要经常压缩空间;
- 想要更可控、可预期的 GC 停顿周期,防止高并发下应用雪崩现象。
G1 的堆内存算法
1. G1 之前的 JVM 内存模型
- 新生代:伊甸园区 (eden space) + 2个幸存区
- 老年代
- 持久代 (perm space):JDK1.8 之前
- 元空间 (metaspace):JDK1.8 之后取代持久代
2. G1收集器的内存模型
2.1 G1 堆内存结构
堆内存会被切分成为很多个固定大小区域(Region),每个是连续范围的虚拟内存。
堆内存中一个区域 (Region) 的大小,可以通过 -XX:G1HeapRegionSize 参数指定,大小区间最小 1M 、最大 32M ,总之是 2 的幂次方。
默认是将堆内存按照 2048 份均分。
2.2 G1 堆内存分配
每个 Region 被标记了 E、S、O 和 H,这些区域在逻辑上被映射为 Eden,Survivor 和老年代。
存活的对象从一个区域转移(即复制或移动)到另一个区域。区域被设计为并行收集垃圾,可能会暂停所有应用线程。如上图所示,区域可以分配到 Eden,survivor 和老年代。
此外,还有第四种类型,被称为巨型区域(Humongous Region)。
Humongous 区域主要是为存储超过 50% 标准 region 大小的对象设计,它用来专门存放巨型对象。如果一个 H 区装不下一个巨型对象,那么 G1 会寻找连续的 H 分区来存储。为了能找到连续的 H 区,有时候不得不启动 Full GC 。
G1 回收流程
在执行垃圾收集时,G1 以类似于 CMS 收集器的方式运行。
1. G1 收集器的阶段,大致分为以下步骤:
1.1 G1 执行的第一阶段:初始标记 ( Initial Marking )
这个阶段是 STW(Stop the World ) 的,所有应用线程会被暂停,标记出从 GC Root 开始直接可达的对象。
1.2 G1 执行的第二阶段:并发标记
从 GC Roots 开始,对堆中对象进行可达性分析,找出存活对象,耗时较长。
当并发标记完成后,开始最终标记 ( Final Marking ) 阶段。
1.3 最终标记
标记那些在并发标记阶段发生变化的对象,将被回收。
1.4 筛选回收
首先,对各个 Regin 的回收价值和成本进行排序,根据用户所期待的 GC 停顿时间,来指定回收计划,回收一部分 Region 。
G1 中提供了 Young GC、Mixed GC 两种垃圾回收模式,这两种垃圾回收模式,都是 Stop The World(STW) 的。
G1 的 GC 模式
1. YoungGC 年轻代收集
在分配一般对象(非巨型对象)时,当所有 eden region 使用达到最大阀值、并且无法申请足够内存时,会触发一次 YoungGC 。
每次 younggc 会回收所有Eden 、以及 Survivor 区,并且将存活对象复制到 Old 区以及另一部分的 Survivor 区。
YoungGC 的回收过程:
- 根扫描,跟 CMS 类似,Stop the world,扫描 GC Roots 对象;
- 处理 Dirty card,更新 RSet;
- 扫描 RSet ,扫描 RSet 中所有 old 区,对扫描到的 young 区或者 survivor 区的引用;
- 拷贝扫描出的存活的对象到 survivor2/old 区;
- 处理引用队列、软引用、弱引用、虚引用。
2. mixed gc
当越来越多的对象晋升到老年代 old region 时,为了避免堆内存被耗尽,虚拟机会触发一个混合的垃圾收集器,即 mixed gc ,该算法并不是一个 old gc ,除了回收整个 young region ,还会回收一部分的 old region 。
这里需要注意:是一部分老年代,而不是全部老年代,可以选择哪些 old region 进行收集,从而可以对垃圾回收的耗时时间进行控制。
G1 没有 fullGC 概念,需要 fullGC 时,调用 serialOldGC 进行全堆扫描(包括 eden、survivor、o、perm)。
G1 的推荐用例
G1 的第一个重要特点:是为用户的应用程序的提供一个低GC延时和大内存GC的解决方案。
这意味着堆大小 6GB 或更大,稳定和可预测的暂停时间将低于 0.5 秒。
如果应用程序使用 CMS 或 ParallelOld 垃圾回收器,具有一个或多个以下特征,将有利于切换到 G1:
- Full GC 持续时间太长或太频繁;
- 对象分配率或年轻代升级老年代很频繁;
- 不期望的很长的垃圾收集时间或压缩暂停(超过 0.5 至 1 秒)。
注意:
如果你正在使用 CMS 或 ParallelOld 收集器,且应用程序没有遇到长时间的垃圾收集暂停,则保持当前收集器就可以了。升级 JDK ,并不需要更新收集器为 G1 。
以上,是 G1 垃圾收集器的解析,欢迎评论区留言交流或拓展。
如果觉得有用,请顺手关注+点赞+转发支持下,谢谢。
作者简介
陈睿 | mikechen , 10 年 + 大厂架构经验,「mikechen 的互联网架构」系列文章作者,专注于互联网架构技术。
阅读「mikechen 的互联网架构」40W 字技术文章合集
Java 并发 | JVM | MySQL | Spring | Redis | 分布式 | 高并发
--- end ---
直通BAT JVM必考题:Minor GCMajor GCFull GC的区别
Java面试过程,JVM属于必考题系列:
直通BAT必考题系列:深入详解JVM内存模型与JVM参数详细配置
直通BAT必考题系列:JVM的4种垃圾回收算法、垃圾回收机制与总结
直通BAT必考题系列:7种JVM垃圾收集器特点,优劣势、及使用场景
直通BAT必考题系列:JVM性能调优的6大步骤,及关键调优参数详解
直通BAT必考题系列:深入剖析JVM之G1收集器、及回收流程、与推荐用例
今天主要谈谈JVM GC的类型和策略,特别是大家经常混淆的Minor GC、Major GC、Full GC,年轻代GC、老年代GC,之间有什么区别和联系。
Minor GC
JVM堆内存被分为两部分:年轻代(Young Generation)和老年代(Old Generation)。
1.年轻代
年轻代是所有新对象产生的地方。当年轻代内存空间被用完时,就会触发垃圾回收。这个垃圾回收叫做Minor GC。年轻代被分为3个部分——Enden区和两个Survivor区。
年轻代空间的要点:
-
大多数新建的对象都位于Eden区。
-
当Eden区被对象填满时,就会执行Minor GC。并把所有存活下来的对象转移到其中一个survivor区。
-
Minor GC同样会检查存活下来的对象,并把它们转移到另一个survivor区。这样在一段时间内,总会有一个空的survivor区。
-
经过多次GC周期后,仍然存活下来的对象会被转移到年老代内存空间。通常这是在年轻代有资格提升到年老代前通过设定年龄阈值来完成的。
2.年老代
年老代内存里包含了长期存活的对象和经过多次Minor GC后依然存活下来的对象。通常会在老年代内存被占满时进行垃圾回收。
Major GC
老年代的垃圾收集叫做Major GC,Major GC通常是跟full GC是等价的,收集整个GC堆。
Minor GC和Major GC其实就是年轻代GC和年老年GC的俗称。而在Hotspot VM具体实现的收集器:Serial GC, Parallel GC, CMS, G1 GC中,大致可以对应到某个Young GC和Old GC算法组合。
分代GC
针对HotSpot VM的实现,其实GC的准确分类可以分为:
-
分代GC
-
Full GC
以及后续的G1的分区收集本质其实还是一个分代收集器,但是和之前的各类回收器不同,它同时兼顾年轻代和老年代。
分代GC并不收集整个GC堆的模式,而是只专注分代收集
-
Young GC:只收集年轻代的GC
-
Old GC:只收集年老代的GC(只有CMS的concurrent collection是这个模式)
-
Mixed GC:收集整个young gen以及部分old gen的GC(只有G1有这个模式)
Full GC
Full GC定义是相对明确的,就是针对整个新生代、老生代、元空间(metaspace,java8以上版本取代perm gen)的全局范围的GC。
没钱没人脉也能轻松入门,让你每年多赚10万!
以上是关于G1 垃圾收集器深入剖析(图文超详解)的主要内容,如果未能解决你的问题,请参考以下文章