JVM中引用计数法与可达性分析

Posted 筱白爱学习

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了JVM中引用计数法与可达性分析相关的知识,希望对你有一定的参考价值。

目录

概要

如何判断对象已死?

引用计数算法

优点

缺点

举例说明

可达性分析

图例说明

GC Roots的对象包括以下几种

可达性分析回收过程

四大引用

回收方法区

        方法区的垃圾收集主要回收两部分内容:

        1. 废弃的常量

        2. 不再使用的类型。 

JVM是否要对类型进行回收参数设置


概要

        提起垃圾收集(GC),肯定会思考垃圾收集完成的工作:哪些内存需要回收?什么时候回收?如何回收?那么,在回收前如何判断对象已死呢?

        在堆里面存放着Java世界中几乎所有的对象实例,垃圾收集器在对堆进行回收前,要确定这些对象之中哪些还“存活”着,哪些已经“死去”。(“死去”即不可能再被任何途径使用的对象)。

如何判断对象已死?

        有两种方式:一种是 引用计数算法、一种是可达性分析算法。

引用计数算法

        该算法判断对象是否存活是这样的:在对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加一;当引用失效时,计数器值就减一;任何时刻计数器为零的对象就是不可能再被使用的。

优点

  • 判定效率很高。

缺点

  • 不会完全准确,因为如果出现两个对象相互引用的问题就不行了。

举例说明

// 示例说明,不用执行
public class ReferenceCountGC

        public Object instance = null;

        public static void testGC()

            // step 1
            ReferenceCountGC gc1 = new ReferenceCountGC();
            // step 2
            ReferenceCountGC gc2 = new ReferenceCountGC();
            // 相互引用
            // step 3
            gc1.instance = gc2;
            // step 4
            gc2.instance = gc1;

            // step 5
            gc1 = null;
            // step 6
            gc2 = null;

            // 假设在这行发生GC,gc1 和 gc2 对象是否会被回收? 不会回收
            System.gc();
        
    

分析代码最终结果:

step1: gc1 的引用+1    =1
step2: gc2 的引用+1    =1

step3: gc2 的引用+1    =2
step4: gc1 的引用+1    =2

step5: gc1 的引用-1    =1
step6: gc2 的引用-1    =1

 由此看出,gc1和gc2在置为null之后,这两个对象已经不可能再被访问了,但是因为它们互相引用着对方,导致它们的引用计数都不为0,于是引用计数算法无法通知GC收集器回收它们。虚拟机这么牛气,自然不会用这样的方法来判断对象的存活状态了。 所以继续往下看,就会明白了

启动参数设置:

        // 打印GC信息 -XX:+PrintGCDetails

可达性分析

        通过一系列的GC Roots的对象作为起始点,从这些根节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的。

        当前主流的商用程序语言(Java、C#,上溯至前面提到的古老的Lisp)的内存管理子系统,都是通过可达性分析(Reachability Analysis)算法来判定对象是否存活的。

        这个算法的基本思路就是通过一系列称为“GC Roots”的根对象作为起始节点集,从这些节点开始,根据引用关系向下搜索,搜索过程所走过的路径称为“引用链”(Reference Chain),如果某个对象到GC Roots间没有任何引用链相连,或者用图论的话来说就是从GC Roots到这个对象不可达时,则证明此对象是不可能再被使用的。

图例说明

 以上所述,红色代表不可达对象(可回收对象)

GC Roots的对象包括以下几种

GC Roots对象示例
在虚拟机栈(栈帧中的本地变量表)中引用的对象譬如各个线程被调用的方法堆栈中使用到的参数、局部变量、临时变量等
在方法区中类静态属性引用的对象譬如Java类的引用类型静态变量
在方法区中常量引用的对象譬如字符串常量池(String Table)里的引用
在本地方法栈中JNI对象(即通常所说的Native方法)引用的对象
Java虚拟机内部的引用如基本数据类型对应的Class对象,一些常驻的异常对象(比如NullPointException、OutOfMemory Error)等,还有系统类加载器
所有被同步锁(synchronized关键字)持有的对象-
反映Java虚拟机内部情况的JMXBean、JVMTI中注册的回调、本地代码缓存等-

        除了这些固定的GC Roots集合以外,根据用户所选用的垃圾收集器以及当前回收的内存区域不 同,还可以有其他对象“临时性”地加入,共同构成完整GC Roots集合。

可达性分析回收过程

        即使在可达性分析算法中判定为不可达的对象,也不是“非死不可”的,这时候他们暂时还处于“缓刑”阶段,要真正宣告一个对象死亡,至少要经历两次标记过程。

1.如果对象A到GC Roots没有引用链,则进行第一次标记;

2.进行筛选,判断此对象是否有必要执行finalize()方法;

3.如果对象A没有重写finalize()方法,或者finalize()方法已经被虚拟机调用过,则虚拟机视为“没有必要执行”,对象A被判定为不可触及的;

4.如果对象A重写了finalize()方法,且还未执行过,那么对象A会被插入到F-Queue队列中,由一个虚拟机自动创建的、低优先级的finalizer线程触发其finalize()方法执行;

注意:这里所说的“执行”是指虚拟机会触发这个方法开始执行,但并不承诺一定会等待它运行结束。这样做的原因是,如果某个对象的finalize()方法执行缓慢,或者更极端地发生了死循环,将很可能导致F-Queue队列中的其他对象永久处于等待,甚至导致整个内存回收子系统的崩溃。

5.finalize()方法是对象逃逸死亡的最后机会,稍后GC会对F-Queue队列中的对象进行第二次小规模的标记;

6.如果这期间对象A在finalize()方法中与引用链上的任何一个对象建立了联系(譬如把自己(this关键字)赋值给某个类变量或者对象的成员变量),那么在第二次标记时,对象A会被移除“即将回收”集合;

7.如果对象这时候还没有逃脱,那基本上它就真的要被回收了。


注意:一个对象的finalize()方法都只会被系统自动调用一次,如果对象面临下一次回收,它的finalize()方法不会被再次执行,所以同样的对象并且重写了finalize(),执行两次,会出现第一次自救成功,第二次就会失败了。


四大引用

        在JDK1.2版本之后,Java对引用的概念进行了扩充,将引用分为强引用(Strongly Re-ference)、软引用(Soft Reference)、弱引用(Weak Reference)、虚引用(Phantom Reference)4种,这4种引用强度依次逐渐减弱。

  • 强引用是最传统的“引用”的定义,是指在程序代码之中普遍存在的引用赋值,即类似“Object obj = new Object()”这种引用关系。无论任何情况下,只要强引用关系还存在,垃圾收集器就永远不会回收掉被引用的对象。
  • 软引用是用来描述一些还有用,但非必须的对象。只被软引用关联着的对象,在系统将要发生内存溢出异常前,会把这些对象列进回收范围之中进行第二次回收,如果这次回收还没有足够的内存,才会抛出内存溢出异常。在JDK 1.2版之后提供了SoftReference类来实现软引用。
  •  弱引用也是用来描述那些非必须对象,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次垃圾收集发生为止。当垃圾收集器开始工作,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。在JDK 1.2版之后提供了WeakReference类来实现弱引用。
  • 虚引用也称为“幽灵引用”或者“幻影引用”,它是最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存使劲按构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的只是为了能在这个对象被收集器回收时受到一个系统通知。在JDK 1.2版之后提供了PhantomReference类来实现虚引用。

回收方法区

        有些人认为方法区(如HotSpot虚拟机种的元空间或者永久代)是没有垃圾收集行为的,《Java虚拟机规范》中提到过可以不要求虚拟机在方法区中实现垃圾收集,事实上也确实有未实现或未能完整实现方法区类型卸载的收集器存在(如JDK 11时期的ZGC收集器就不支持类卸载),方法区垃圾收集的“性价比”通常也是比较低的:在Java堆中,尤其是在新生代中,对常规应用进行一次垃圾收集通常可以回收70%至99%的内存空间,相比之下,方法区回收囿于苛刻的判定条件,其区域垃圾收集的回收成果往往远低于此。

        方法区的垃圾收集主要回收两部分内容:

        1. 废弃的常量

        回收废弃常量与回收Java堆中的对象非常类似。

       判断一个常量是否“废弃”。

        举例说明:

               假如一个字符串“java”曾经进入常量池中,但是当前系统又没有任何一个字符串的值是“java”,换句话说,已经没有任何字符串对象引用常量池中的“java”常量,且虚拟机中也没有其他地方引用这个字面量。如果在这时发生内存回收,而且垃圾收集器判断确有必要的话,这个“java”常量就将会被系统清理出常量池。常量池中其他类(接口)、方法、字段的符号引用也与此类似。

        2. 不再使用的类型。 

        判断一个类型是否属于“不再被使用的类”。

        需要满足三个条件:

  • 该类所有的实例都已经被回收,也就是Java堆中不存在该类及其任何派生子类的实例。
  • 加载该类的类加载器已经被回收,这个条件除非是经过精心设计的可替换类加载器的场景,如OSGi、JSP的重加载等,否则通常是很难达成的。
  • 该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。

        Java虚拟机被允许对满足上述三个条件的无用类进行回收,这里说的仅仅是“被允许”,而并不是和对象一样,没有引用了就必然会回收。

JVM是否要对类型进行回收参数设置

  •  提供了-Xnoclassgcc参数进行控制
  • -verbose:class
  • -XX:+TraceClass-Loading  查看类加载
  • -XX:+TraceClassUnLoading  卸载信息

-verbose:class和-XX:+TraceClass-Loading可以在Product版的虚拟机中使用;

-XX:+TraceClassUnLoading参数需要FastDebug版的虚拟机支持。

 在大量使用反射、动态代理、CGLib等字节码框架,动态生成JSP以及OSGi这类频繁自定义类加载器的场景中,通常都需要Java虚拟机具备类型卸载的能力,以保证不会对方法区造成过大的内存压力。


关于引用计数法与可达性分析就先介绍到这里了。

作者:筱白爱学习!!

欢迎关注转发评论点赞沟通,您的支持是筱白的动力!

JVM垃圾收集之可达性分析

JVM垃圾收集之可达性分析

JVM进行垃圾回收时会判断对象是否可以回收,我们需要对其进行概念上了解哪些对象是“垃圾”、JVM进入GC阶段时如何保证回收时的安全性和高效性。

是否回收对象的判断依据

JVM中主要有两种算法判断对象是否可回收,第二种算法是重点

  • 引用计数算法

    • 给对象添加一个引用计数器,每当一个地方引用它时,计数器+1;当一个地方不再引用它时,计数器-1;直至计数器为0时,代表没有任何一个地方引用此对象,则判断对象“已死”。

    • JVM并没有引用这种算法,因为它存在对象之间相互循环引用的弊端

  • 可达性分析算法

    • 以一系列的GC Roots为起点开始向下搜索,搜索所走过的路径称为引用链,当对象与GC Roots不可达(一个对象与GC Roots没有任何的引用链相连)时,代表此对象是不可用的,应该被回收。

  • GC Roots常见对象:

1. 虚拟机栈的栈帧中(局部变量表)引用的对象

2. 方法区中类静态属性引用的对象

3. 方法区中常量引用的对象

4. 本地方法栈中JNI(Native方法)引用的对象

引用计数算法弊端的代码:

public void testGC(){ ReferenceCount objA = new ReferenceCount();    ReferenceCount objB = new ReferenceCount(); /** * 除了它们相互引用之外,没有任何引用,实际上这两个对象 * 已经不可能被外界访问了,但是正因为互相引用而导致引用 * 计数器不为0,所以引用计数算法无法通知GC收集器去收集它们。      */ objA.instance = objB; objB.instance = objA; }

如上图,Object1 - Object4对象与GC Roots是有引用链的,但是Object5 - Object7虽然彼此之间有连通,但是它们没有与任何一个GC Roots相连(与GC Roots不可达),所以这三个对象在JVM看来是可回收的。

HotSpot虚拟机中的算法实现

  1. 枚举根节点

GC Roots主要存在全局性的引用(常量和类静态属性)和执行上下文(栈帧的本地变量表)中

1.1 可达性分析的执行对“引用一致性”非常地敏感,所以在枚举根节点时必须停顿所有线程

  • “引用一致性”解释

当JVM进行可达性分析时,必须保持当前的引用链是保持不变的,否则分析结果有可能会出现偏差。例如:在分析某个对象时得出其余GC Roots不可达的结论,但是在分析完成之前此对象在某一个地方被重新引用,但是JVM是不会重复进行分析的,显然结果会不正确。

1.2 缩短停顿时间

  • HotSpot通过一组OopMap的数据结构达到目的,在类加载完成时,HotSpot就把对象内什么偏移量上是什么类型的数据计算出来,并且存放在OopMap中,GC在扫描时遍历OopMap就可以得到所有引用关系了。

  1. 安全点(Safe Points)

    如果在程序中含有大量的指令,对象引用关系不断变化,每一次变化都会生成一条新的OopMap,那么必然会导致OopMap也变得越来越庞大,遍历所使用的开销也会越来越大,此时使用安全点这种解决方案可以有效地解决这个问题。

解决什么时候安全地进入GC的问题,安全点能够让所有线程进行中断挂起。

Safe Point的意义:

保证所有线程当前的所有引用状态不会发生变化,所有线程要保证在安全点处中断。

JVM进入GC阶段的两种线程中断方式(不是安全点的中断方式):

1. 抢先式中断:

  • 在GC发生时,让所有的线程进行中断,如果发现线程不是在安全点上,那么就恢复它,让它跑到安全点再进行中断。现在几乎没有虚拟机采用抢先式中断来暂停线程进行响应GC事件,突然地中断和恢复线程会导致程序出现很奇怪的现象。

2. 主动式中断:

  • 当GC操作需要中断线程时,不直接对线程进行操作,而是设置一个轮询标志,让线程执行时主动轮询这一个标志,轮询标志为true时主动中断轮询标志的地方和安全点是重合的,另外还有创建对象需要分配内存的地方也会有轮询标志。这样保证了线程执行到JVM认为该线程可以停止的地方,而不会突然地中断线程了。

Safe Point通常存在的位置

    1.方法调用处

    2. 循环跳转处

    3. 异常跳转处

    4. 指令序列复用

Safe Points位置的选取特征:是否具有让程序长时间运行的特征。

  1. 安全区域(Safe Region)

如果程序不执行,有可能处于Sleep或Blocked状态,CPU没有分配给线程使用,此时线程肯定无法自己“跑”到安全点处再执行中断挂起,而JVM也不可能等待线程被唤醒,安全点这种方案无法满足GC的要求,所以此时需要采用安全区域方案。

安全区域是指在一段代码片段之中,引用关系不会发生变化,在此区域内的任何地方进行GC操作都是安全的,我们可以这样理解:安全区域就是一小块含有无穷无尽的安全点的区域

执行过程:

在线程进入Safe Origin时,线程将主动标记自己进入了Safe Origin区域,此时JVM发起GC时就不用在乎这些在Safe Origin的线程了,当线程要离开Safe Origin时,它会检查系统是否已经完成了根节点枚举或者整个GC过程,如果已完成,则可以离开;若未完成,则需要等待允许离开Safe Origin的信号为止。

结尾



感谢你们阅读我编写的推文!今天主要是对是否回收对象的判断依据和对象可达性分析算法进行了简单地介绍,如果我有任何写得不正确和不准确的地方,欢迎大家向我提出来,我们可以一起学习和交流!下一篇推文将会垃圾回收算法

2019年9月25日

小菠萝

以上是关于JVM中引用计数法与可达性分析的主要内容,如果未能解决你的问题,请参考以下文章

JVM——判断对象的死活

深入理解JVM——虚拟机GC

深入理解JVM——虚拟机GC

JVM并发的可达性分析

浅谈JVM(下)

JVM垃圾收集之可达性分析