java基础 --- Java内存结构

Posted Overboom

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java基础 --- Java内存结构相关的知识,希望对你有一定的参考价值。

1. 概述

C编译器在划分内存区域的时候经常将管理的区域划分为数据段和代码段,数据段包括堆、栈以及静态数据区。那么在Java语言当中,内存又是如何划分的呢?

由于Java程序是交由JVM执行的,所以我们在谈Java内存区域划分的时候事实上是指JVM内存区域划分。在讨论JVM内存区域划分之前,先来看一下Java程序具体执行的过程:

如上图所示,首先Java源代码文件(.java后缀)会被Java编译器编译为字节码文件(.class后缀),然后由JVM中的类加载器加载各个类的字节码文件,加载完毕之后,交由JVM执行引擎执行。在整个程序执行过程中,JVM会用一段空间来存储程序执行期间需要用到的数据和相关信息,这段空间一般被称作为Runtime Data Area(运行时数据区),也就是我们常说的JVM内存。因此,在Java中我们常常说到的内存管理就是针对这段空间进行管理(如何分配和回收内存空间)。

2. 运行时数据区包括那几部分

根据《Java虚拟机规范》的规定,运行时数据区通常包括这几个部分:程序计数器(Program Counter Register)、Java栈(VM Stack)、本地方法栈(Native Method Stack)、方法区(Method Area)、堆(Heap)。

其中,方法区和堆是所有线程共享的,每一个线程都有一个程序计数器。方法区还有一个运行时常量池。

3. 运行时数据区每部分存储了哪些数据

3.1 程序计数器

        程序计数器(Program Counter Register),也有称作为PC寄存器。想必学过汇编语言的朋友对程序计数器这个概念并不陌生,在汇编语言中,程序计数器是指CPU中的寄存器,它保存的是程序当前执行的指令的地址(也可以说保存下一条指令的所在存储单元的地址),当CPU需要执行指令时,需要从程序计数器中得到当前需要执行的指令所在存储单元的地址,然后根据得到的地址获取到指令,在得到指令之后,程序计数器便自动加1或者根据转移指针得到下一条指令的地址,如此循环,直至执行完所有的指令。

        虽然JVM中的程序计数器并不像汇编语言中的程序计数器一样是物理概念上的CPU寄存器,但是JVM中的程序计数器的功能跟汇编语言中的程序计数器的功能在逻辑上是等同的,也就是说是用来指示 执行哪条指令的。

  由于在JVM中,多线程是通过线程轮流切换来获得CPU执行时间的,因此,在任一具体时刻,一个CPU的内核只会执行一条线程中的指令,因此,为了能够使得每个线程都在线程切换后能够恢复在切换之前的程序执行位置,每个线程都需要有自己独立的程序计数器,并且不能互相被干扰,否则就会影响到程序的正常执行次序。因此,可以这么说,程序计数器是每个线程所私有的。

  在JVM规范中规定,如果线程执行的是非native方法,则程序计数器中保存的是当前需要执行的指令的地址;如果线程执行的是native方法,则程序计数器中的值是undefined。

  由于程序计数器中存储的数据所占空间的大小不会随程序的执行而发生改变,因此,对于程序计数器是不会发生内存溢出现象(OutOfMemory)的。

3.2 Java虚拟机栈

        每一个线程都有自己的java虚拟机栈,这个栈与线程同时创建,一个线程中的每个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。每个线程有一个私有的栈,随着线程的创建而创建。栈里面存着的是一种叫“栈帧”的东西,每个方法会创建一个栈帧,栈帧中存放了局部变量表(基本数据类型和对象引用)、操作数栈、动态连接和返回地址等信息。当前运行方法对应的栈帧叫做当前栈帧。下面主要对这个栈帧进行一个介绍。

首先,局部变量表里存放了编译期间可知的各种基本数据类型(8种)、对象引用、returnAddress类型(指向一条字节码指令的地址)。他有如下特点:

  • 64位长度的long和double类型占用2个局部变量空间(Slot),其余数据类型只占用一个。
  • 局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,
  • 在方法运行期间不会改变局部变量表的大小。

        接下来操作数栈,其实在栈帧刚刚创建的时候,操作数栈是空的,java虚拟机可以从局部变量表或者对象的实例字段中,复制一些常量或者变量值到操作数栈中。也可以从操作数栈中取走数据。他的深度在编译期就已经确定了。

        动态连接是什么意思呢?在这里我们先有个基本的印象,下面举例子的时候,再来看这个解释比较容易理解一点,我们知道,在线程中一个方法去调用另外一个方法,是通过符号引用来实现的,动态连接的作用就是把这个符号引用表示的方法转化为实际方法的直接引用。

对于java虚拟机栈的描述,最后看一下可能发生的异常情况

  • 如果线程请求分配的栈容量超过java虚拟机栈所允许的最大容量,java虚拟机就会抛出StackOverfolwError
  • 如果java虚拟机栈动态扩展,在扩展时没有申请到足够的内存或者是创建新线程时没有足够的内存再创建java虚拟机栈了,那么java虚拟机就会抛出outOfMemoryError

3.3 本地方法栈

        本地方法栈与Java栈的作用和原理非常相似。区别只不过是Java栈是为执行Java方法服务的,而本地方法栈则是为执行本地方法(Native Method)服务的。在JVM规范中,并没有对本地方发展的具体实现方法以及数据结构作强制规定,虚拟机可以自由实现它。在HotSopt虚拟机中直接就把本地方法栈和Java栈合二为一。

3.4 堆

        在C语言中,堆这部分空间是唯一一个程序员可以管理的内存区域。程序员可以通过malloc函数和free函数在堆上申请和释放空间。那么在Java中是怎么样的呢?

  Java中的堆是用来存储对象本身的以及数组(当然,数组引用是存放在Java栈中的)。只不过和C语言中的不同,在Java中,程序员基本不用去关心空间释放的问题,Java的垃圾回收机制会自动进行处理。因此这部分空间也是Java垃圾收集器管理的主要区域。另外,堆是被所有线程共享的,在JVM中只有一个堆。

3.5 方法区/元空间

  方法区在JVM中也是一个非常重要的区域,它与堆一样,是被线程共享的区域。在方法区中,存储了每个类的信息(包括类的名称、方法信息、字段信息)、静态变量、常量以及编译器编译后的代码等。

  在Class文件中除了类的字段、方法、接口等描述信息外,还有一项信息是常量池,用来存储编译期间生成的字面量和符号引用。

  在方法区中有一个非常重要的部分就是运行时常量池,它是每一个类或接口的常量池的运行时表示形式,在类和接口被加载到JVM后,对应的运行时常量池就被创建出来。当然并非Class文件常量池中的内容才能进入运行时常量池,在运行期间也可将新的常量放入运行时常量池中,比如String的intern方法。

  在JVM规范中,没有强制要求方法区必须实现垃圾回收。很多人习惯将方法区称为“永久代”,是因为HotSpot虚拟机以永久代来实现方法区,从而JVM的垃圾收集器可以像管理堆区一样管理这部分区域,从而不需要专门为这部分设计垃圾回收机制。不过自从JDK7之后,Hotspot虚拟机便将运行时常量池从永久代移除了。

        Java8里面不存在永久代了,取而代之的是元空间。方法区里面的哪些东西,大部分都被移到堆里面去了,还剩下一些元数据保存在元空间里面。

 

Java中存在三种常量池:分别是Class文件常量池、运行时常量池、字符串常量池。Java8以后,这三种常量池都放在堆里面了。

 

参考链接:

https://www.cnblogs.com/dolphin0520/p/3613043.html

https://zhuanlan.zhihu.com/p/68145978

https://zhuanlan.zhihu.com/p/60888097

 

 

 

 

以上是关于java基础 --- Java内存结构的主要内容,如果未能解决你的问题,请参考以下文章

java基础 --- Java内存结构

Java基础——JVM内存结构

Java基础72问:java迭代器的方法

Java小技巧:java从零基础到项目实战

Java堆内存与栈内存对比

详解Jvm内存结构