《趣学编程》深入理解Java虚拟机

Posted 2022-12-01 旷世奇才李先生

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了《趣学编程》深入理解Java虚拟机相关的知识，希望对你有一定的参考价值。

哈喽！大家好，我是小奇，一位不靠谱的程序员
小奇打算以轻松幽默的对话方式来分享一些技术，如果你觉得通过小奇的文章学到了东西，那就给小奇一个赞吧
文章持续更新，可以微信搜索【小奇JAVA面试】第一时间阅读，回复【资料】更有我为大家准备的福利哟！

文章目录

前言
面试
Java虚拟机内存模型
垃圾收集器与内存分配策略
虚拟机性能监控、故障处理工具
总结

前言

作为一名Java程序员，Java虚拟机是我们不必学会就可以搬砖工作的一种技能点，但是小奇为什么还要讲一下呢？难道就是为了浪费大家1分钟的宝贵时间，一个人1分钟，50万人就是1年，5000万人就是100年，赚了，小奇以一己之力成功搞挂一个人（血赚）。

当然不是，并且小奇的文章也没有那么多人看，最多也就浪费个肾吧。

学习Java虚拟机是因为面试官要问啊！，所以我们就要学，什么？不实用的你不学？那邻居小奇可要使劲学啦，到时候面试官只要小奇不要你。

至于你问为什么面试官要问Java虚拟机呢，这个。。。我把这次机会留给你，下次你面试的时候面试官问：“讲一下Java虚拟机的内存模型”。你：“面试官你好，请问为什么你要问Java虚拟机呢，你给我台电脑，我五分钟给你搭建好图书管理系统他不香吗，咱们键盘上见真章”。这时面试官就会告诉你答案，你就可以把答案打在评论区，让小奇以及众多小伙伴一起知道一下到底为什么要问？

面试

在一个晴朗的周日，我来到了一个陌生的园区（别问为什么是周日，问就是997，不过为了填饱肚子的打工人，只能明知山有虎、偏向虎山行），坐在陌生的会议室，等待HR小姐姐去叫面试官，此时我的心情和各位小伙伴一样五味杂陈，担心面试官问的会不会很难？问到我的知识盲区我该怎么办？
一会自我介绍的时候要不要吹一下我和小奇的关系？

一位英俊潇洒，眼神犀利的面试官走了进来，看到他那犀利、仿佛能看穿一切的眼神，我在想要不然一会就不要20k了，要8k得了，这个面试官一看就不好糊弄啊，但是我想起来我来之前刚看了小奇的趣学编程系列，我已经完全学会了小奇的精髓，我顿时就来了底气，决定一会要30k，不给就学小奇赖着不走（哈哈）

面试官：小奇是吧，带简历了吗？

我：没带，现在彩印两块一张，我简历五张，每次面试都要花费十块，我朋友说了还没工作就先让你掏钱的工作不要去。

面试官：。。。那你靠什么来征服我，让我录用你

我：气质？

（此时面试官并没有叫保安，而是从门后拿出了恭候我多时的棍子，我瞬间怂了）

（我只好从我的双肩包中拿出了我从上午没有面试通过的其他公司面试官手中要回的简历，上午的情形是这样的，上午的面试官：今天的面试就到这吧，回去等通知吧！我：面试官你好，如果贵公司不打算录取我的话，能不能把我的纸质简历还给我，我下午还有一家面试。上午的面试官：我说你的简历怎么皱皱巴巴，原来你一直在循环利用啊！这个症状出现多久了？我：半拉月了。。。）

（当我把皱皱巴巴的简历交给面试官后，这场面试才得以继续进行。。。）

Java虚拟机内存模型

面试官：我看你简历上写的精通Java虚拟机？（哼，面试官轻蔑的一笑）

（此时我的内心非常紧张，紧张的并不是面试官把我问住，而是我如果虚拟机这方面回答的太专业了面试官听不懂怎么办，他如果不信我回答的怎么办，此时我偷偷看了一下我藏在桌下的《深入理解Java虚拟机》，如果他不信我就拿出书来和他对峙）

我：也不算精通吧，都是同行们抬爱。

面试官：那你说一下JVM虚拟机的内存模型吧

我：JVM虚拟机中有一个运行时数据区，里面主要分为程序计数器、虚拟机栈、本地方法栈、堆、方法区

面试官：嗯。假如我们new一个对象这个时候是放在哪里？

我：堆里

面试官：嗯。假如我们int定义一个变量number放在哪里？

我：栈里

面试官：嗯。小伙子真是惜字如金啊，能不能详细介绍一下这几个区域都是干什么的吗

我：那我就献丑了。。。

1.程序计数器：简单来说每一个线程在执行代码的时候执行到哪一行是有一个记录的，比如线程A执行到代码第10行了这个时候在线程A中是有一个程序计数器来记录10这一行。程序计数器在线程中是私有的。那么他有什么好处呢？虽然我们开发的时候可以使用多线程来开发，但是CPU在执行A线程的时候B线程就需要等待，等到CPU去执行A线程的时候B线程又需要等待了，所以说如果这个时候CPU去执行B线程，那么执行完后再回来执行A线程的时候就知道之前执行到哪一行了，可以从这一行接着执行。

2.虚拟机栈：与程序计数器一样，虚拟机栈也是线程私有的，虚拟机是栈是存放执行方法的时候用到的一些信息，例如在执行方法的时候虚拟机就会创建一个栈帧用于存储局部变量表（表里是局部变量）、操作数栈（如果要进行一些数的计算，那么会把数先读取到操作数栈中进行操作最后赋值到局部变量表中）、动态链接、方法出口等信息。

3.堆：堆是线程共享的，堆是虚拟机所管理的内存中最大的一块，一般优化就是优化这块内存，比如我们Student st = new Student();那么我们新创建出来的对象就在堆内存里。

4.本地方法栈：本地方法栈是用来执行本地方法的时候所使用的，例如Java中我们会看到很多Native方法，这些方法使用例如c语言写的，Java中只是调用。

5.方法区：方法区是线程共享的，它用于存储已被虚拟机加载的类型信息、常量、静态变量等。在方法区中还包含一个运行时常量池部分，这一部分用于存放编译期生成的各种字面量与符号引用，这部分内容将在类加载后存放到方法区的运行时常量池中，所谓符号引用其实就是将一个例如main方法这个方法引用转化为指针应用，可以更加快速的找到这个方法在磁盘中的真正位置

面试官：嗯。可以，回答的很全面，平时都怎么学习提高呢？

我：看小奇的文章（此时真想给小奇的文章一个赞）

面试官：说一下对象创建的流程吧

我：（还想歇会喝口水呢，这么快就问下一个知识点了，我偷偷翻书看一下。。。）

当虚拟机接收到new Student()的命令后，他会先去常量池中查看这个Student()类是否有相应的符号引用，并且这个类是否被加载、解析、初始化过，如果没有的话需要先进行类的加载、解析、初始化。

面试官：嗯。那我创建对象的时候怎么给它分配内存呢，有哪些方法？

我：可以使用指针碰撞、空闲列表等方式。

指针碰撞：假如堆空间现在没有数据，并且堆空间是一个方形的空间，那么我们用一个指针放在起始位置，也就是紧挨着边，这个时候有一个占用1M的对象要创建了，那么我们的指针就从初始位置开始从左向右走1M的距离，这个时候又有一个10M的对象要创建了，我们的指针从当前位置又向右走了10M的距离，这个时候有一个1G的对象来了（指针：我淦。。。），指针向右走到头了也没有1G的距离，这个时候就创建不了这个1G的对象了。
空闲列表：指针碰撞的方式适用于堆空间连续的这种方式，如果不连续的话就不能从左到右来分配空间了，这个时候就需要用到空闲列表了，使用一个空闲列表来记录哪些空间是空闲的，新创建一个对象就放到那里去。

面试官：嗯。那我们刚刚创建了一个对象，你能说一下对象里又是怎样的一个内存布局吗？

我：（真是往祖坟里挖啊。。。偷偷看看书，淦）

对象里可以划分为三个部分：对象头、实例数据、对齐填充。

面试官：额。。。可以详细展开了说一下吗，你这样别人也能答出来

我：（就看了一眼书，记不住那么多啊，算了硬着头皮来吧）

对象头：对象头中存储了对象自身运行时的数据，如哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳以及指向它的类型元数据的指针（通过这个指针来确定对象是哪个类的实例）。

实例数据：这一部分是我们真正在对象中定义的信息，比如对象中的一些字段等内容，还有继承父类的一些内容和在子类中定义的字段都在此记录。

对齐填充：这一部分并不是每个对象都存在的，因为虚拟机要求对象的起始地址必须是8字节的整数倍，假如我们实例数据只有4字节，那么我们需要另外填充4字节的数据来保证对象的起始位置是8字节的整数倍。.

垃圾收集器与内存分配策略

面试官：嗯。说一下虚拟机怎么判断一个对象是否是垃圾对象

我：（这么快又换下一个知识点了，啥时候能喝口水呢。。。）

可以采用可达性分析算法和引用计数算法来判断对象是否是垃圾对象。

面试官：嗯。继续说下去

我：

可达性分析算法：会从一个“GC Root”根开始依据引用关系向下搜索，如果不能搜索到的证明是垃圾对象。

引用计数算法：当一个对象被引用的时候就会在这个对象中的引用计数器中加1，如果引用失效时，计数器的值就会减1，当这个对象的引用计数器为0的时候就证明这个对象是垃圾对象，不过这种算法有一个缺点，就是两个对象之间相互引用的时候就会认为两个对象都不是垃圾对象，但是这两个对象是因为循环依赖造成的问题，理应被清理掉，但是这种算法解决不了这种循环引用的问题。

面试官：嗯。有哪些垃圾收集算法呢？

我：（二分法、三分法、四。。。不对，怎么感觉背串了，还是不编了，偷偷看一下书吧）

标记-清除算法、标记-复制算法、标记-整理算法

面试官：嗯。可以再详细的说一下算法的具体内容吗？

我：

标记-清除算法：此算法主要用于一块内存区的垃圾收集器，在标记后直接做清除操作，不会再做后续的操作。

标记-复制算法：此算法主要用于两块内存区的垃圾收集器，将存活对象标记，然后将存活对象放入保留区域中，然后将之前的一块区域全部清理掉作为下一次的保留区域。

标记-整理算法：此算法主要用于一块内存区的垃圾收集器，他与标记清除算法的区别在于他清除后会将内存区域中存活的对象重新整理到一起，使得剩下的空间可以连续起来。

面试官：嗯。可以说一下都有哪些垃圾收集器吗？

我：（三V肉、爬牛、爬V肉死砍胃汁、三V肉偶得、爬V肉偶得、CMS、G1、ZGC，我想了想还是画出来吧，毕竟我的英语水平读出来面试官可能会怀疑人生）

1、Serial收集器（三V肉）

Serial收集器是最基础、历史最悠久的收集器，这个收集器是一个单线程工作的收集器。

2、ParNew收集器（爬牛）

ParNew收集器实质上是Serial收集器的多线程并行版本，可以同时使用多条线程进行垃圾收集。

3、Parallel Scavenge 收集器（爬V肉死砍胃汁）

Parallel Scavenge收集器是一款新生代收集器，它是基于标记-复制算法实现的收集器。Parallel Scavenge收集器的目标则是达到一个可控制的吞吐量，所谓吞吐量就是处理器用于运行用户代码的时间与处理器总消耗时间的比值，即。

4、Serial Old收集器（三V肉偶得）

Serial Old是Serial收集器的老年代版本，它同样是一个单线程收集器。

5、Parallel Old收集器（爬V肉偶得）

Parallel Old收集器是Parallel Scavenge收集器的老年代版本，支持多线程并行收集，基于标记-整理算法实现。

6、CMS收集器

CMS收集器是一种以获取最短回收停顿时间为目标的收集器，它的运作过程分为四个步骤，包括：

1> 初始标记

2> 并发标记

3> 重新标记

4> 并发清除

初始标记：初始标记需要stw，初始标记仅仅只是标记一下GC Roots能直接关联到的对象，速度很快。

并发标记：并发标记阶段就是从GC Roots的直接关联对象开始遍历整个对象图的过程，这个过程耗时较长但是不需要停顿用户线程，可以与垃圾收集线程一起并发运行。

重新标记：重新标记阶段则是为了修正并发标记期间，因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录，这个阶段的停顿时间通常会比初始标记阶段稍长一些，但也远比并发标记阶段的时间短。

并发清除：这个阶段清理删除掉标记阶段判断的已经死亡的对象，由于不需要移动存活对象，所以这个阶段也是可以与用户线程同时并发的。

6、Garbage First 收集器（简称G1收集器）

G1不再坚持固定大小以及固定数量的分代区域划分，而是把连续的Java堆划分为多个大小相等的独立区域（Region），每一个Region都可以根据需要，扮演新生代的Eden空间、Survivor空间，或者老年代空间。如图。

G1收集器的运作过程大致可以划分为以下四个步骤：

初始标记：仅仅只是标记一下GC Roots能直接关联到的对象，

并发标记：从GC Root开始对堆中对象进行可达性分析，递归扫描整个堆里的对象图，找出要回收的对象，这阶段耗时较长，但可与用户程序并发执行。

最终标记：对用户线程做另一个短暂的暂停，用于处理并发阶段结束后仍遗留下来的最后那少量的SATB记录。

筛选回收：负责更新Region的统计数据，对各个Region的回收价值和成本进行排序，根据用户所期望的停顿时间来制定回收计划，可以自由选择任意多个Region构成回收集，然后把决定回收的那一部分Region的存活对象复制到空的Region中，再清理掉整个旧Region的全部空间。这里的操作设计存活对象的移动，是必须暂停用户线程，由多条收集器线程并行完成的。

面试官：嗯。可以说一下JVM堆内存模型吗？

我：

堆内存模型分为年轻代和老年代，其中年轻代中又分为Eden区和Survivor区，Survivor区又分为S0和S1区。

面试官：嗯。可以说一下对象在堆中的流转与回收策略吗？

我：（这可有点多了。。。说了不知道你能不能听得懂啊，算了，不行就拿出我藏在桌下的书给你讲吧）

对象优先在Eden分配：new一个对象首先会放到Eden区中，当Eden区域放满了后，会将Eden区域中存活的对象放入到Survivor区中的S0区域，然后将Eden区域清空，这个时候新new的对象还是放入Eden区域中，当Eden区域中再次满了的话就将Eden区域中的存活对象和S0中的存活对象都拿出来放入到S1区域中，并将Eden区域和S0区域中都清理掉，当Eden区域再次满了就向Eden区域中的存活对象和S1中的存活对象一起放入到S0中，也就是循环将Eden区域中的存活对象和Survivor中的其中一块区域中的存活对象一块拿出来放入到Survivor中的另外一块区域中，如此循环，每循环一次对象的GC年龄加1，当GC年龄到达15的时候就会移入到老年代。
放入老年代的时候的GC我们可以称他为轻GC，这个GC的时间比较短，当老年代满了的时候会进行重GC，这个GC的时间比较长。

长期存活的对象进入老年代：就是对象在年轻代来回循环，到达15次（默认，这个数值可以设置），就会将对象放入老年代。

大对象直接进入老年代：当新创建的对象比较大的时候我们可以直接将他放入老年代，这样可以避免在年轻代来回复制造成的额外开销，具体多大的对象是大对象我们可以根据 -XX:PretenureSizeThreshold参数来设置。

动态对象年龄判定：如果在Survivor空间中低于或等于某年龄的所有对象大小的总和大于Survivor空间的一半，那么年龄大于或等于该年龄的对象就可以直接进入老年代，无需等到年龄达到15，假如现在最大的对象年龄为10，但是Survivor空间以及使用一半了，如果再往下走可能还没有对象达到15就造成Survivor区域满了，所以就提前将大年龄的对象放入老年代了。

空间分配担保：在发生轻GC之前，虚拟机就会先检查老年代可用的空间是否大于新生代所有对象的总空间，如果大于，即便新生代所有的对象都不是垃圾对象，那么老年代也放的下，如果不大于呢？虚拟机会先查看是否设置了允许担保失败的参数，如果允许，虚拟机会判断老年代的剩余空间是否大于历次从新生代到老年代里的对象的平均大小。
如果大于就会进行轻GC将新生代的存活对象放入老年代，这一次是冒险的，因为有可能这一次轻GC比之前轻GC的平均值存活的要多，这样会造成老年代内存直接溢出。
如果小于就会先进行一次重GC将老年代的空间腾出来，保证可以将年轻代的存活对象放进去。
如果配置的参数是不允许担保失败，那么我们每一次到达老年代剩余的空间不够新生代所有对象的总空间的时候我们就会进行一次重GC将老年代的空间先腾出来。

面试官：可以啊，小伙子有点东西

我：还行吧（有点东西你不给我倒点水喝。。。）

虚拟机性能监控、故障处理工具

面试官：刚才都是一些概念性的东西，现在问你点实操的，说一下有哪些虚拟机性能监控方法呢？

我：（刚想歇一会。。。早知道简历上写精通Java虚拟机会被这么问我就只写了解Java虚拟机了，哎。。。）

jps：虚拟机进程状态工具
命令格式：jps 【options】【hostid】
jps -l命令可以查看主类全名，如果进程执行的是jar包，则输出jar路径

jps -v命令可以查看虚拟机进程启动时的JVM参数

jstat：虚拟机统计信息监视工具
命令格式：jstat 【options】【hostid】【ms】【count】
参数ms和count代表查询间隔和次数，如果省略了这个2个参数，说明只查询一次，假设现在我们要查询66320的垃圾收集情况，250毫秒查询一次，一共查询20次
jstat -gc 66320 250 20