「BAT面试必问之JVM」—JVM会如此简单?

Posted 昊卓集团

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了「BAT面试必问之JVM」—JVM会如此简单?相关的知识,希望对你有一定的参考价值。

「BAT面试必问之JVM」—JVM会如此简单?


 一:虚拟机内存图解

JAVA程序运行与虚拟机之上,运行时需要内存空间。虚拟机执行JAVA程序的过程中会把它管理的内存划分为不同的数据区域方便管理。

虚拟机管理内存数据区域划分如下图:


「BAT面试必问之JVM」—JVM会如此简单?


数据区域分类:

方法区: (Method Area)

虚拟机栈 : (VM Stack)

本地方法栈 : (Native Method Stack)

堆: (Heap)

程序计数器: (Program Counter Register)

直接内存 : (Direct Memory)

说明:


1. 程序计数器

行号指示器,字节码指令的分支、循环、跳转、异常处理、线程恢复(CPU切换),每条线程都需要一个独立的计数器,线程私有内存互不影响,该区域不会发生内存溢出异常。


2. 虚拟机栈


「BAT面试必问之JVM」—JVM会如此简单?


3. 本地方法栈

与虚拟机栈类似,虚拟机栈为Java程序服务,本地方法栈支持虚拟机的运行服务,具体实现由虚拟机厂商决定,也会抛出 stackOverFlowError、OutOfMemory异常。


4. 堆

是虚拟机管理内存中最大的一部分,被所有线程共享,用于存放对象实例(对象、数组),物理上不连续的内存空间,由于GC收集器,分代收集,所以划分为:新生代 Eden、From SurVivor空间、To SurVivor空间,allot buffer(分配空间),可能会划分出多个线程私有的缓冲区,老年代。


5. 方法区

与堆一样属于线程共享的内存区域,用于存储虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码(动态加载OSGI)等数据。理论上属于java虚拟机的一部分,为了区分开来叫做 Non-Heap非堆。

这个区域可以选择不进行垃圾回收,该区域回收目的主要是常量池的回收,及类型的卸载class,内存区不足时会抛出OutOfMemory异常


运行时常量池:

方法区的一部分,Class的版本、字段、接口、方法等,及编译期生成的各种字面量、符号引用,编译类加载后存放在该区域。会抛出OutOfMemory异常。


6. 直接内存


二:对象访问内部实现过程


一、 句柄方式 (访问)



「BAT面试必问之JVM」—JVM会如此简单?


二、指针方式 (访问)


「BAT面试必问之JVM」—JVM会如此简单?


优缺点:

指针访问方式:优点速度快,节省了指针定位时间开销


三:内存区域控制参数及对应溢出异常

开发过程中,或程序运行过程中每次遇到OutOfMemory异常或GC异常或StackOverflowError异常我们都是一堆参数乱配,都把值调大,只是大体知道是跟jvm内存分配有关,具体应该怎么调,对应的异常应该调整那些参数,或者换句话说,jvm内存分配区域中都分别对应那些参数大多数情况下都是不知道的,只是把相关的参数跳上去,预期结果都是应该起作用,到底能不能起作用,自己心里也没底。下面就来说一下jvm堆、栈、方法区等内存区域对应的参数,及每个区域可能抛出的异常类型,发生异常的场景分析。


一、参数类型

1.堆空间参数

2.栈空间参数

3.方法区空间参数

4.本机直接内存参数


二、异常类型

1.OutOfMemory异常

2.StackOverflowError异常


三、辅助参数说明

1.-XX:+HeapDumpOnOutOfMemoryError 打印堆内存异常时打印出快照信息

2.-XX:+HeapDumpPath 快照输出路径

3.-Xmn指定eden区的大小 -XX:SurvirorRation来调整幸存区的大小

4.-XX:PretenureSizeThreshold设置进入老年代的阀值


四、参数说明、对应场景的异常

1.堆内存参数

-Xms:堆最小值(新生代和老年代之和)

-Xmx:堆最大值(新生代和老年代之和)

当最小值=最大值时,这时堆内存是不可扩展的。

例:-Xms80M -Xmx80M

通常将-Xmx和-Xms设置为一样的大小来减少gc的次数,堆内存不足时抛出OutOfMemoryError异常。


2.栈内存参数

-Xss

例:-Xss128k

单线程下无论栈帧太大还是栈容量太小,及引用深度超过虚拟机允许深度都会抛出StackOverflowError每个方法压入栈的帧大小是不一致的。多线程下当每个线程分配栈帧太大内存不能够扩展时抛出OutOfMemoryError异常线程栈帧越大,可创建的线程越少。


3.方法区参数

-XX:PermSize方法区内存最小值

-XX:MaxPermSize 方法区内存最大值

各个线程共享的内存区域,主要用来存储类的元数据、常量、静态变量、即时编译器编译后的代码等数据

例:-XX:PermSize=20M -XX:MaxPermSize=20M

异常类型 OutOfMemoryError :

原因:常量过多,或代理反射等使用频繁


4.本机直接内存参数

-XX:MaxDirectMemorySize

例:-XX:MaxDirectMemorySize=10M

不足时抛出OutOfMemory异常


四:垃圾收集算法

经典的垃圾回收算法以下几种


一、标记--清除算法(Mark-Sweep)

回收前状态:


「BAT面试必问之JVM」—JVM会如此简单?


回收后状态:


「BAT面试必问之JVM」—JVM会如此简单?


优缺点:

算法执行分为两个阶段标记与清除,所有的回收算法,基本都

基于标记回收算法做了深度优化

缺点:效率问题,内存空间碎片(不连续的空间)


二、复制算法(Copying)

回收前状态:

Eden内存空间 8


「BAT面试必问之JVM」—JVM会如此简单?


Survivor1空间(From空间)1


「BAT面试必问之JVM」—JVM会如此简单?


Survivor2空间(To空间) 1


「BAT面试必问之JVM」—JVM会如此简单?


Eden内存空间与Survivor空间 8:1


「BAT面试必问之JVM」—JVM会如此简单?


回收后状态:


「BAT面试必问之JVM」—JVM会如此简单?


Survivor1空间(From空间)1


「BAT面试必问之JVM」—JVM会如此简单?


Eden内存空间与Survivor空间 8:1


「BAT面试必问之JVM」—JVM会如此简单?


优缺点:

比较标记清除算法,避免了回收造成的内存碎片问题,

缺点:以局部的内存空间牺牲为代价,不过空间的浪费比较小,默认8:1的比例1是浪费的。

复制也有一定的效率与空间成本


三、标记整理算法(Mark-Compact)

回收前状态:


「BAT面试必问之JVM」—JVM会如此简单?


回收后状态:


「BAT面试必问之JVM」—JVM会如此简单?


优缺点:

避免了,空间的浪费,与内存碎片问题。

缺点:整理时复制有效率成本。


五:垃圾收集器

一、七种垃圾收集器

(1) Serial(串行GC)-XX:+UseSerialGC

(2) ParNew(并行GC)-XX:+UseParNewGC

(3) Parallel Scavenge(并行回收GC)

(4) Serial Old(MSC)(串行GC)-XX:+UseSerialGC

(5) CMS(并发GC)-XX:+UseConcMarkSweepGC

(6) Parallel Old(并行GC)-XX:+UseParallelOldGC

(7) G1(JDK1.7update14才可以正式商用)


「BAT面试必问之JVM」—JVM会如此简单?


二.1~3用于年轻代垃圾回收:

年轻代的垃圾回收称为minor GC


三.4~6用于年老代垃圾回收(当然也可以用于方法区的回收):年老代的垃圾回收称为full GC

G1独立完成"分代垃圾回收"

注意:并行与并发

并行:多条垃圾回收线程同时操作

并发:垃圾回收线程与用户线程一起操作


四、常用五种组合

Serial/Serial Old

ParNew/Serial Old:与上边相比,只是比年轻代多了多线程垃圾回收而已

ParNew/CMS:当下比较高效的组合

Parallel Scavenge/Parallel Old:自动管理的组合

G1:最先进的收集器,但是需要JDK1.7update14以上


五. Serial/Serial Old

年轻代Serial收集器采用单个GC线程实现"复制"算法(包括扫描、复制)

年老代Serial Old收集器采用单个GC线程实现"标记-整理"算法

Serial与Serial Old都会暂停所有用户线程(即STW)

说明:

STW(stop the world):编译代码时为每一个方法注入safepoint(方法中循环结束的点、方法执行结束的点),在暂停应用时,需要等待所有的用户线程进入safepoint,之后暂停所有线程,然后进行垃圾回收。

适用场合:

CPU核数<2,物理内存<2G的机器(简单来讲,单CPU,新生代空间较小且对STW时间要求不高的情况下使用)

-XX:UseSerialGC:强制使用该GC组合

-XX:PrintGCApplicationStoppedTime:查看STW时间


六.ParNew/Serial Old:

ParNew除了采用多GC线程来实现复制算法以外,其他都与Serial一样,但是此组合中的Serial Old又是一个单GC线程,所以该组合是一个比较尴尬的组合,在单CPU情况下没有Serial/Serial Old速度快(因为ParNew多线程需要切换),在多CPU情况下又没有之后的三种组合快(因为Serial Old是单GC线程),所以使用其实不多。

-XX:ParallelGCThreads:指定ParNew GC线程的数量,默认与CPU核数相同,该参数在于CMS GC组合时,也可能会用到


七.Parallel Scavenge/Parallel Old:


「BAT面试必问之JVM」—JVM会如此简单?


八、调优方法

8.1 新对象预留新生代

由于fullGC(老年代)的成本远比minorGC(新生代和老年代)的成本大,所以给应用分配一个合理的新生代空间,尽量将对象分配到新生代减小fullGC的频率

8.2 大对象进入老年代

将大对象直接分配到老年代,保持新生代对象的结构的完整性,以提高GC效率, 以通过-XX:PretenureSizeThreshold设置进入老年代的阀值

8.3 稳定与震荡的堆大小

稳定的对大小是对垃圾回收有利的,方法将-Xms和-Xmx的大小一致

8.4 吞吐量优先

尽可能减少系统执行垃圾回收的总时间,故采用并行垃圾回收器

-XX:+UseParallelGC或使用-XX:+UseParallelOldGC

8.5 降低停顿

使用CMS回收器,同时减少fullGC的次数


九、获取gc信息的方法

9.1 -verbose:gc或者-XX:+PrintGC 获取gc信息

9.2 -XX:+PrintGCDetails 获取更加详细的gc信息

9.3 -XX:+PrintGCTimeStamps 获取GC的频率和间隔

9.4 -XX:+PrintHeapAtGC 获取堆的使用情况

9.5 -Xloggc:D:gc.log 指定日志情况的保存路径


十、jvm调优实战-tomcat启动加速

在tomcat的bin/catalina.bat文件的开头添加相关的配置


六:监控工具

监控工具:一般问题定位,性能调优都会使用到。


(一)、jps

Jps是参照Unix系统的取名规则命名的,而他的功能和ps的功能类似,可以列举正在运行的饿虚拟机进程并显示虚拟机执行的主类以及这些进程的唯一ID(LVMID,对应本机来说和PID相同),他的用法如下:

Jps [option] [hostid]

jps -q 只输出LVMID

jps -m 输出JVM启动时传给主类的方法

jps -l 输出主类的全名,如果是Jar则输出jar的路径

jps -v 输出JVM的启动参数


(二)、jstat

jstat主要用于监控虚拟机的各种运行状态信息,如类的装载、内存、垃圾回收、JIT编译器等,在没有GUI的服务器上,这款工具是首选的一款监控工具。其用法如下:

jstat [option vmid [interval [s|ms] [vount] ] ]

jstat 监控内容 线程好 刷新时间间隔 次数

jstat –gc 20445 1 20 :监视Java堆,包含eden、2个survivor区、old区和永久带区域的容量、已用空间、GC时间合计等信息

jstat –gcutil 20445 1 20:监视内容与-gc相同,但输出主要关注已使用空间占总空间的百分比

jstat –class 20445 1 20:监视类的装载、卸载数量以及类的装载总空间和耗费时间等

.......-gccapcity......:监视内容与-gc相同,但输出主要关注Java区域用到的最大和最小空间

.......-gccause........:与-gcutil输出信息相同,额外输出导致上次GC产生的原因

.......-gcnew..........:监控新生代的GC情况

.......-gcnewcapacity..:与-gcnew监控信息相同,输出主要关注使用到的最大和最小空间

.......-gcold..........:监控老生代的GC情况

.......-gcoldcapacity..:与-gcold监控信息相同,输出主要关注使用到的最大和最小空间

.......-gcpermcapacity.:输出永久带用到的最大和最小空间

.......-compiler.......:输出JIT编译器编译过的方法、耗时信息

.......-printcompilation:输出已经被JIT编译的方法


(三)、jinfo

jinfo的作用是实时查看虚拟机的各项参数信息jps –v可以查看虚拟机在启动时被显式指定的参数信息,但是如果你想知道默认的一些参数信息呢?除了去查询对应的资料以外,jinfo就显得很重要了。jinfo的用法如下:

Jinfo [option] pid


(四)、jmap

「BAT面试必问之JVM」—JVM会如此简单?


(五)、jstack

Jstack用于JVM当前时刻的线程快照,又称threaddump文件,它是JVM当前每一条线程正在执行的堆栈信息的集合。生成线程快照的主要目的是为了定位线程出现长时间停顿的原因,如线程死锁、死循环、请求外部时长过长导致线程停顿的原因。通过jstack我们就可以知道哪些进程在后台做些什么?在等待什么资源等!其运行格式如下:

Jstack [option] vmid

-F 当正常输出的请求不响应时强制输出线程堆栈

-l 除堆栈信息外,显示关于锁的附加信息

-m 显示native方法的堆栈信息


(六)、jconsole

在JDK的bin目录下,监控内存,thread,堆栈等


(七)、jprofile

类似于jconsole,比jconsole监控信息更全面,内存,线程,包,cup 类,堆栈,等等






「BAT面试必问之JVM」—JVM会如此简单?







以上是关于「BAT面试必问之JVM」—JVM会如此简单?的主要内容,如果未能解决你的问题,请参考以下文章

面试必问之JVM原理

详解BAT面试必问之ThreadLocal(源码+内存)

BAT大厂java程序员面试必问:JVM+Spring+分布式+tomcat+MyBatis

这道面试必问的JVM面试题70%的Java程序员会做错

jvm基础--JVM内存模型

jvm基础--JVM内存模型