带你了解什么是Java虚拟机运行时数据区

Posted Java_LingFeng

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了带你了解什么是Java虚拟机运行时数据区相关的知识,希望对你有一定的参考价值。

一、前言

程序都是运行在内存里的,所以对于一门开发语言来说,对于内存的管理都是重中之重的,前有C、C++需要开发者管理内存,后有Java的自动内存管理,到如今的内存安全的Rust。

二、运行时数据区概览

Java虚拟机在运行Java程序时会把其管理的内存划分为若干个区域。这些区域有些是随着Java虚拟机进程的启动而一直存在,有的区域是依赖用户线程的启动和结束而创建和销毁。在《Java虚拟机规范》中的规定,Java虚拟机所管理的区域如下:

​Java是支持多线程编程的,数据共享区域就是运行中的Java程序中的线程都可以访问的区域。反之,数据隔离区域线程私有的区域,每个线程都有的一块区域。

三、各运行数据区介绍

3.1 程序计数器

线程私有的一个区域,是一块较小的内存区域,可以看作是当前线程所执行的字节码的行号指示器。程序计数器指向下一条需要执行的字节码执行,是程序控制流的指示器,分支、循环、跳转、异常处理、线程回复等功能都需要依赖程序计数器来完成。

我们都知道多线程并发处理其实就是多个线程之间轮流切换,分配CPU的执行时间。在任何一个时刻一个处理器只会执行一个线程中的指令。因此在多个线程之间切换时,需要保留被切走的线程的执行现场,为了就是让这个线程重新得到CPU的执行时间时可以恢复到正确的执行位置,所以每个线程需要有一个独立的程序计数器,各个线程之间互不影响,独立存储。所以说程序计数器这块区域是“线程私有的”。

3.2 Java虚拟机栈

同样也是线程私有的内存区域,Java里面每个方法被执行的时候,Java虚拟机都会创建一个栈帧用于存储局部变量、操作数栈、动态链接、方法出口等信息。一个方法的调用到结束就是对应一个栈帧在Java虚拟机栈中入栈到出栈的过程。

局部变量表中存放了编译期间可知的各种基本数据类型、对象引用和returnAddress类型。局部变量表所需的内存空间在编译期间完成分配,在方法的运行期间不会改变局部变量表的大小。这里的"大小"指的是变量槽的数量,每个槽的大小是由虚拟机实现的,譬如按照一个槽32bit或64bit甚至更大。

《Java虚拟机规范》中规定了Java虚拟机栈的两类异常情况:

1、如果线程的请求的栈深度大于java虚拟机栈的深度将抛出StackOverflowError异常,如太深的递归容易导致此异常。

2、如果Java虚拟机栈容量可以动态扩展,当栈扩展时无法申请到足够的内存会抛出OutOfMemoryError

3.3 本地方法栈

与Java虚拟机栈的作用相似,其区别在于Java虚拟机栈为虚拟机执行Java方法服务的,而本地方法是为虚拟机使用到的本地方法服务的。在jdk源码中以native修饰就是本地方法,具体以对应的虚拟机来实现。例如:sun.misc.Unsafe里的很多方法就是本地方法。

《Java虚拟机规范》中没有规定本地方法栈使用的语言、使用方式与数据结构并没有任何的强制限制,因此具体的虚拟机可以自由的实现,例如Hot-Spot虚拟机直接把本地方法栈和虚拟机栈合二为一,所以也会像虚拟机栈一样会抛出stackOverflowError和OutOfMemotyError异常。

3.4 Java堆

虚拟机管理的内存中最大的一块,也是我们Java开发者最为关注的一块内存区域。Java堆是线程共享的一块内存区域,在虚拟机启动的时候创建,用于存放对象实例,Java中几乎所有的对象实例都在这里分配内存。由于即时编译技术的进步,尤其是逃逸分析技术的日渐强大,栈上分配、标量替换优化手段导致一些微妙的变化发生,所以说Java对象示例都在对上分配已经渐渐变得不是那么绝对。

以G1垃圾收集器为分界:

  • Hot-Spot虚拟机在G1垃圾收集器之前,垃圾收集都是分代收集,因此堆内存又被划分为老年代和新生代,默认老年代占堆空间的2/3,新生代占1/3。其中新生代又被划分为Eden和Survivor区,其中Survivor是由两个大小相等的区域组成:form和to。可以说G1之前的垃圾收集器都说是基于分代来设计的,需要新生代、老年代的收集器搭配才能工作。

  • G1出现之后,边不再区分新生代和老年代,Java堆使用同一个垃圾收集器

在《Java虚拟机规范》中规定,Java堆可以处于物理上不连续的内存空间上,但逻辑上应该是连续的。但是对于大对象,大多数虚拟机出于实现简单、存储高效的考虑,很有可能要求连续的内存空间。

Java堆的大小被实现成固定大小的,也可以是可扩展的,不过当前的主流的Java虚拟机都是可扩展来实现的,通过-Xmx和-Xms设置。如果Java堆中没有了内存可以分配给示例,并且堆无法扩展时,会抛出OutOfMemoryError的异常,也就是常说的OOM。

3.5 方法区

线程共享的一个内存区域,用于存储被虚拟机加载的类型信息、常量、静态变量、即时编译后的代码缓存等数据。

在JDK8之前,HotSpot虚拟机把垃圾收集器的分代设计扩展到了方法去,使用永久代来实现方法区。所以在JDK8之前会称方法区为永久代。这样做的原因是,这样做HotSpot的垃圾收集器可以像管理Java堆一样来管理这块内存区域。但是其他的Java虚拟机是没有永久代这一个概念的。

到了JDK6后,HotSpot虚拟机便放弃了使用永久代来实现方法区,而是使用本地内存来实现方法区,到了JDK7把原来放在永久代的字符串常量池、静态变量等移出(移到Java堆),而到了JDK8完全废弃了永久代的概念,改用像JRockit、J9一样在本地内存中实现的元空间来替代永久代。并且把JDK7中永久代剩下的内用全部移到元空间,这部分的内容主要是类型信息。

在《Java虚拟机规范》中的规定,对于方法区和Java堆一样不一定需要连续的内存和可以选择固定大小或者扩展外。甚至方法区还可以选择不实现垃圾收集。垃圾收集在方法区上是比较少出现的。方法区的回收目标主要是针对常量池的回收和对类型的卸载。同时也规定,如果方法区无法满足新的内存分配需求时,将抛出OutOfMemoryError异常。

3.6 运行时常量池

运行时常量池属于方法区的一部分。Class文件的类版本、字段、方法、接口等描述信息外,还有一项信息就是常量池表,用于存放编译期生成的各种字面量和符号引用,这部分内用将在类加载后存放在方法区的运行时常量池中。

一般来说出来保存Class文件中描述的符号引用外,还会把符号引用翻译出来的直接引用也存储在运行时常量池中。

运行时常量池相对于Class文件常量池的另外一个重要特性就是具备动态性,Java语言不要求常量只有编译器才能产生,并非预置入Class文件中常量池的内容才能进入方法区运行时常量池,运行期间也可以将新的常量放入池中,这种特性被开发人员利用得最多的时String类的intern()方法。

运行时常量池是方法区的一部分,自然受到方法区内存的限制,当常量池无法再申请到内存时会抛出OutOfMemoryError异常。

3.7 直接内存

直接内存并不是Java虚拟机运行时数据区的一部分,也不在《Java虚拟机规范》中定义的区域。但是这一块区域也是被频繁使用,同时也有可能导致OutOfMemoryError异常。

在JDK1.4中加入了NIO,引入了基于通道(Channel)与缓冲区的I/O方式,它可以使用Native函数直接分配对外内存,然后通过一个存储在Java堆中的DirectByteBuffer对象作为这块堆外内存的引用进行操作。以此来提升I/O性能,避免了在Java堆和Native堆中来回复制数据。

本机直接内存的分配不会收到Java堆大小的限制,但是使用的内存,所以会本机的总内存大小以及处理器寻址空间的限制,一般服务器管理员配置虚拟机参数时,会根据实际内存区设置Xmx等参数,但经常会忽略直接内存,使得各个内存区域总和大于物理内存本身,从而导致动态扩容的时候出现OOM。

Java虚拟机运行时数据区

运行时数据区域

Java虚拟机在Java程序运行时会将内存区域划分成若干个不同的区域,各自负责不同的职责,这些区域都有各自的用途。

1.Java虚拟机运行时数据区分为以下几个部分。

2.方法区、虚拟机栈、本地方法栈、堆、程序计数器,如下图所示:

Java虚拟机运行时数据区

程序计数器

程序计数器是一块较小的内存空间,可以看作当前线程所执行的字节码行号指示器。需要注意以下几点内容:

1.程序计数器是线程私有,各线程之间互不影响。

2.在任何一个确定的时刻,一个处理器都只会执行一条线程中的指令。

4.如果是native方法,则计数器值为空(native 方法 指得就是Java程序调用了非Java代码,算是一种引入其它语言程序的接口)。

5.程序计数器也是在Java虚拟机规范中唯一没有规定任何OutOfMemoryError异常情况的区域。

java虚拟机栈

可通过参数 栈帧是方法运行期的基础数据结构栈容量可由-Xss设置

1.Java虚拟机栈是线程私有的,它的生命周期与线程相同。

2.每一个方法被调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。

3.虚拟机栈是执行Java方法的内存模型(也就是字节码)服务:每个方法在执行的同时都会创建一个栈帧,用于存储

局部变量表、操作数栈、动态链接、方法出口等信息。

局部变量表:32位变量槽,存放了编译期可知的各种基本数据类型、对象引用、returnAddress类型。

操作数栈:基于栈的执行引擎,虚拟机把操作数栈作为它的工作区,大多数指令都要从这里弹出数据、执行运算,然后把结果压回操作数栈。

动态连接:每个栈帧都包含一个指向运行时常量池(方法区的一部分)中该栈帧所属方法的引用。持有这个引用是为了支持方法调用过程中的动态连接。Class文件的常量池中有大量的符号引用,字节码中的方法调用指令就以常量池中指向方法的符号引用为参数。这些符号引用一部分会在类加载阶段或第一次使用的时候转化为直接引用,这种转化称为静态解析。另一部分将在每一次的运行期间转化为直接应用,这部分称为动态连接

方法出口:返回方法被调用的位置,恢复上层方法的局部变量和操作数栈,如果无返回值,则把它压入调用者的操作数栈。

4.局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的。

5.在方法运行期间不会改变局部变量表的大小。主要存放了编译期可知的各种基本数据类型、对象引用 (reference类型)、returnAddress类型)。

http://www.runoob.com/java/java-basic-datatypes.html

java虚拟机栈,规定了两种异常状况

1.如果线程请求的深度大于虚拟机所允许的深度,将抛出StackOverflowError异常。
2.如果虚拟机栈动态扩展,而扩展时无法申请到足够的内存,就会抛出OutOfMemoryError异常。

本地方法栈

可通过参数 栈容量可由-Xss设置

1.虚拟机栈为虚拟机执行Java方法(也就是字节码)服务。

2.本地方法栈则是为虚拟机使用到的Native方法服务。有的虚拟机(譬如Sun HotSpot虚拟机)直接就把本地方法栈和虚拟机栈合二为一。

java堆(Java Heap)

可通过参数 -Xms 和-Xmx设置

1.Java堆是被所有线程共享,是Java虚拟机所管理的内存中最大的一块 Java堆在虚拟机启动时创建。

2.Java堆唯一的目的是存放对象实例,几乎所有的对象实例和数组都在这里。

3.Java堆为了便于更好的回收和分配内存,可以细分为:新生代和老年代;再细致一点的有Eden空间、From Survivor空间、To Survivor区。

新生代:包括Eden区、From Survivor区、To Survivor区,系统默认大小Eden:Survivor=8:1。

老年代:在年轻代中经历了N次垃圾回收后仍然存活的对象,就会被放到年老代中。因此,可以认为年老代中存放的都是一些生命周期较长的对象。

4.Survivor空间等Java堆可以处在物理上不连续的内存空间中,只要逻辑上是连续的即可(就像我们的磁盘空间一样。在实现时,既可以实现成固定大小的,也可以是可扩展的)。

据Java虚拟机规范的规定,当方法区无法满足内存分配需求时,将抛出OutOfMemoryError异常。

方法区(Method Area)

可通过参数-XX:MaxPermSize设置

1.线程共享内存区域,用于储存已被虚拟机加载的类信息、常量、静态变量,即编译器编译后的代码,方法区也称持久代(Permanent Generation)。

2.虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做Non-Heap(非堆),目的应该是与Java堆区分开来。

3.如何实现方法区,属于虚拟机的实现细节,不受虚拟机规范约束。

4.方法区主要存放java类定义信息,与垃圾回收关系不大,方法区可以选择不实现垃圾回收,但不是没有垃圾回收。

5.方法区域的内存回收目标主要是针对常量池的回收和对类型的卸载。

6.运行时常量池,也是方法区的一部分,虚拟机加载Class后把常量池中的数据放入运行时常量池。

运行时常量池

可通过参数-XX:PermSize和-XX:MaxPermSize设置

常量池(Constant Pool):常量池数据编译期被确定,是Class文件中的一部分。存储了类、方法、接口等中的常量,当然也包括字符串常量。

字符串池/字符串常量池(String Pool/String Constant Pool):是常量池中的一部分,存储编译期类中产生的字符串类型数据。

运行时常量池(Runtime Constant Pool):方法区的一部分,所有线程共享。虚拟机加载Class后把常量池中的数据放入到运行时常量池。常量池:可以理解为Class文件之中的资源仓库,它是Class文件结构中与其他项目资源关联最多的数据类型。

1.常量池中主要存放两大类常量:字面量(Literal)和符号引用(Symbolic Reference)。

2.字面量:文本字符串、声明为final的常量值等;。

3.符号引用:类和接口的完全限定名(Fully Qualified Name)、字段的名称和描述符(Descriptor)、方法的名称和描述符。

JDK1.6之前字符串常量池位于方法区之中
JDK1.7字符串常量池已经被挪到堆之中

直接内存

可通过-XX:MaxDirectMemorySize指定,如果不指定,则默认与Java堆的最大值(-Xmx指定)一样

直接内存(Direct Memory)并不是虚拟机运行时数据区的一部分,也不是Java虚拟机规范中定义的内存区域,但是这部分内存也被频繁地使用,而且也可能导致OutOfMemoryError异常出现。

hotspot虚拟机对象探秘

对象的创建

主要探讨HotSpot虚拟机在Java堆中对象分配、布局和访问的全过程

虚拟机遇到new指令时

1.首先去检查这个指令的参数能否在常量池中定位到一个类的符号引用,并且检查引用代表的类是否已被加载、解析和初始化过。如果没有,则执行类加载过程(第7章 虚拟机类加载机制)。

2.加载检查通过后,分配内存(内存在类加载完成后便可完全确定)。

3.内存分配完成后,虚拟机对对象进行必要的设置,如对象是哪个类的实例、如何找到类的元数据信息等(都放在对象的对象头中)。

4.从虚拟机角度看,一个新的对象产生了,但从java程序视角看,对象创建才刚刚开始,因为 方法还没有执行,,所有字段为零。执行new指令之后会接着执行 方法(构造方法),进行初始化,这样一个真正可用的对象才算完成产生。

对象的内存布局

对象在内存中存储的布局可以分为3块区域:对象头、实例数据、对齐填充

对象头包含两部分(Header)

存储对象自身的 运行时数据,如哈希码、GC分代年龄等。长度在32位和64位的虚拟机中,分别为32bit、 64bit,官方称它为“Mark Word”。

类型指针,对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。

注:如果对象是一个java数组,对象头中还必须有一块记录数据长度的数据

实例数据(InstanceData)

对象真正存储的有用信息,也是程序中定义的各种类型的字段内容。

对齐填充(Padding)

对象的访问定位

1.Java程序通过栈上的reference数据来操作堆上的具体对象。

2.不同虚拟机实现的对象访问方式会有所不同,目前主流的访问方式有两种:使用句柄和直接指针。

4.使用直接指针 是直接访问,优点就是速度快。

推荐阅读







Contact

  • 出处:http://www.ymq.io

  • 版权归作者所有,转载请注明出处

点击“阅读原文”

以上是关于带你了解什么是Java虚拟机运行时数据区的主要内容,如果未能解决你的问题,请参考以下文章

Java虚拟机运行时数据区

Java虚拟机运行时数据区

JVM学习2.Java虚拟机运行时数据区

JVM学习2.Java虚拟机运行时数据区

jvm原理--------2.Java虚拟机运行时数据区

JVM从小白学成大佬Java虚拟机运行时数据区