深入了解Java虚拟机和内存管理

Posted zj-blog

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深入了解Java虚拟机和内存管理相关的知识,希望对你有一定的参考价值。

1.java程序的执行过程

     java源文件->解析器->class文件->java类加载器->java运行时数据区->执行引擎

   技术分享图片

2.我们接下来看一下java运行时数据区

     包含程序计数器,虚拟机栈,本地方法栈,方法区,堆,其中程序计数器,虚拟机栈,本地方法区属于指令,方法区和堆属于数据。

 一、程序计数器

       用来指示程序执行哪一条指令,这跟汇编语言的程序计数器的功能在逻辑上是一样的。JVM规范中规定,如果线程执行的是非native方法,则程序计数器指向的是当前线程正在执行的字节码指令的地址和行号,如果线程执行的是native方法,则程序计数器中的值undefined。每个线程都有自己独立的程序计数器。为什么呢?因为多线程下,一个CPU内核同一时间只会执行一条线程中的指令,因此为了使每个线程在线程切换之后能够恢复到切换之前的程序执行的位置,所以每个线程都有自己独立的程序计数器。

二、Java虚拟机栈(VM Stack

     java虚拟机栈中存放的是一个个栈帧,栈是一种数据结构,数据结构是用来存放数据的,所以虚拟机栈也是用来存放数据的。存储当前线程运行方法是所需要的  数据,指令和返回地址。当程序执行一个方法时,就会创建一个栈帧并压入栈中,执行完毕,则会从栈帧中移除栈。虚拟机栈中有:局部变量表,操作数栈,动态链接,方法出口。

       局部变量表:

             存放局部变量的表,java的基本的数据类型(boolean、byte、char、short、int、float、long、double),对象的引用(reference类型,它不等同于对象本身,可能是一个指向对象起始地址的引用指针,也可能是指向一个代表对象的句柄或其他与此对象相关的位置)和returnAddress类型(指向了一条字节码指令的地址),其中64位长度的long和double类型的数据会占用2个局部变量空间(Slot),其余的数据类型只占用1个。局部变量表的大小在编译器就可以确定其大小了,因此在程序执行期间局部变量表的大小是不会改变的。在Java虚拟机规范中,对这个区域规定了两种异常状况:如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError异常;如果虚拟机栈可以动态扩展(当前大部分的Java虚拟机都可动态扩展,只不过Java虚拟机规范中也允许固定长度的虚拟机栈),如果扩展时无法申请到足够的内存,就会抛出OutOfMemoryError异常。

        操作数栈:

           虚拟机把操作数栈作为它的工作区,程序中的所有计算过程都是在借助于操作数栈来完成的,大多数指令都要从这里弹出数据,执行运算,然后把结果压回操作数栈。

       动态连接:
         每个栈帧都包含一个指向运行时常量池中该栈帧所属方法的引用(指向运行时常量池:在方法执行的过程中有可能需要用到类中的常量,持有这个引用是为了支持方法调用过程中的动态连接.
      方法返回地址:
    当一个方法执行完毕之后,要返回之前调用它的地方,因此在栈帧中必须保存一个方法返回地址。
      本地方法栈(Native Method Stack):
      本地方法栈与虚拟机栈所发挥的作用是非常相似的,它们之间的区别不过是虚拟机栈为虚拟机执行Java方法(也就是字节码)服务,而本地方法栈则 为虚拟机使用到的Native方法服务。与虚拟机栈一样,本地方法栈区域也会抛出StackOverflowError和OutOfMemoryError异常。
三、方法区(Method Area):
          方法区与Java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、以及编译器编译后的代码等。运行时常量池(Runtime Constant Pool)是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池(Constant Pool Table),用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。在JVM规范中,没有强制要求方法区必须实现垃圾回收。很多人习惯将方法区称为“永久代”,是因为HotSpot虚拟机以永久代来实现方法区,从而JVM的垃圾收集器可以像管理堆区一样管理这部分区域,从而不需要专门为这部分设计垃圾回收机制。不过自从JDK7之后,Hotspot虚拟机便将运行时常量池从永久代移除了。
 四、堆(Heap):
     在C语言中,程序员可以通过malloc函数和free函数在堆上申请和释放空间。那么在Java中是怎么样的呢?Java中的堆是用来存储对象本身的以及数组(当然,数组引用是存放在Java栈中的),几乎所有的对象实例都在这里分配内存。在Java中,程序员基本不用去关心空间释放的问题,Java的垃圾回收机制会自动进行处理。另外,堆是被所有线程共享的,在JVM中只有一个堆。
、内存管理:

             JVM将内存划分为6个部分:PC寄存器(也叫程序计数器)、虚拟机栈、堆、方法区、运行时常量池、本地方法栈

           技术分享图片

   

  • PC寄存器(程序计数器):用于记录当前线程运行时的位置,每一个线程都有一个独立的程序计数器,线程的阻塞、恢复、挂起等一系列操作都需要程序计数器的参与,因此必须是线程私有的。

  • java 虚拟机栈:在创建线程时创建的,用来存储栈帧,因此也是线程私有的。java程序中的方法在执行时,会创建一个栈帧,用于存储方法运行时的临时数据和中间结果,包括局部变量表、操作数栈、动态链接、方法出口等信息。这些栈帧就存储在栈中。如果栈深度大于虚拟机允许的最大深度,则抛出StackOverflowError异常。

    • 局部变量表:方法的局部变量列表,在编译时就写入了class文件
    • 操作数栈:int x = 1; 就需要将 1 压入操作数栈,再将 1 赋值给变量x
  • java堆:java堆被所有线程共享,堆的主要作用就是存储对象。如果堆空间不够,但扩展时又不能申请到足够的内存时,则抛出OutOfMemoryError异常。

  •      技术分享图片
    • 方法区:方发区被各个线程共享,用于存储静态变量、运行时常量池等信息。

    • 本地方法栈:本地方法栈的主要作用就是支持native方法,比如在java中调用C/C++

     、垃圾回收机制:

  技术分享图片

       技术分享图片

    (2)、可达性分析

    设立若干根对象(GC Root),每个对象都是一个子节点,当一个对象找不到根时,就认为该对象不可达。

    技术分享图片

    3、怎么回收?

  •         标记——清除算法
  •        复制算法
  •        分代算法

      (1)、标记——清除算法

      遍历所有的GC Root,分别标记处可达的对象和不可达的对象,然后将不可达的对象回收。

      缺点是:效率低、回收得到的空间不连续

      (2)、复制算法

     将内存分为两块,每次只使用一块。当这一块内存满了,就将还存活的对象复制到另一块上,并且严格按照内存地址排列,然后把已使用的那块内存统一回   收。

       优点是:能够得到连续的内存空间 
       缺点是:浪费了一半内存

   

      (3)、分代算法

     在java中,把内存中的对象按生命长短分为:

  •      新生代:活不了多久就go die 了,比如局部变量
  •      老年代:老不死的,活的久但也会go die,比如一些生命周期长的对象
  •      永久代:千年王八万年龟,不死,比如加载的class信息
  •      有一点需要注意:新生代和老年代存储在java虚拟机堆上 ;永久代存储在方法区上

  技术分享图片

     补充:java finalize()方法:

    在被GC回收前,可以做一些操作,比如释放资源。有点像析构函数,但是一个对象只能调用一次finalize()方法。

   

    


以上是关于深入了解Java虚拟机和内存管理的主要内容,如果未能解决你的问题,请参考以下文章

深入理解Java内存区域

玩点深入的:Java 虚拟机内存结构及编码实战

java虚拟机和内存优化总结

深入了解 JVM虚拟机

基于JVM原理JMM模型和CPU缓存模型深入理解Java并发编程

java虚拟机和java内存区域概述