深入探究jvm之GC的算法及种类

Posted liuyk-code

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深入探究jvm之GC的算法及种类相关的知识,希望对你有一定的参考价值。

一、GC基本概念

  GC(Garbage Collection)垃圾收集,1960年最早在List中使用。在Java中GC回收的对象是堆空间和永久区,可以有效避免程序员人为造成内存泄漏问题。将堆空间和永久区没有作用的对象进行释放和回收。

二、GC算法

1、引用计数法:

  是一种老牌的垃圾回收算法,通过引用计算来回收垃圾,被COM、ActionScript3、Python所使用。

  引用计数法的实现很简单,对于一个对象A,只要有任何一个对象引用了A,那么A的引用计数器就会+1,当引用失效时,引用计数器就会-1。只要对象A的引用计数器的值为0,那么对象A 就不可能再被使用。

  技术分享图片技术分享图片技术分享图片技术分享图片技术分享图片

  引用计数法存在的问题:

  1)引用和去引用伴随着加法,程序运行时随时都发生着引用和去引用,影响性能;

  2)很难处理循环引用的问题,如下图:

技术分享图片技术分享图片技术分享图片技术分享图片技术分享图片

   中间节点未被根节点引用,但经过一次循环后引用计数为2,仍然不会被清除,实际上应该被清除。

2、标记-清除法:

  标记-清除算法是现代垃圾回收算法的思想基础。标记-清除算法将垃圾回收分为两个阶段:标记阶段和清除阶段。一种可行的实现是,在标记阶段,首先通过根节点,标记所有从根节点开始的可达对象。因此未被标记的对象就是未被引用的垃圾对象。然后在清除阶段,清除所有未被标记的对象。

技术分享图片技术分享图片

 

   灰色对象都是根节点的可达对象,黑色对象未被根节点引用(直接或间接),白色部分为空闲空间。清理阶段会将黑色对象(未被标记)清理掉。

3、标记-压缩法:

  标记-压缩算法适合存活对象比较多的场合,如老年代。它在标记-清除算法的基础上做了一些优化。和标记-清除算法一样,标记-压缩算法也首先需要从根节点开始,对所有可达对象做一次标记,但之后,它并不仅仅简单的清理未标记的对象,而是将所有存活的对象压缩到内存的一端。之后清理边界外所有的对象。如下图:

技术分享图片技术分享图片技术分享图片

4、复制算法

  与标记-清除算法相比,复制算法是一种相对高效的回收算法,但不适用于存活对象较多的场合,如老年代。

  它主要实现方案是将原有的内存空间分为两块,每次只使用其中的一块,在垃圾回收时,将正在使用的内存中的存活对象复制到未被使用的内存块中,之后,清除正在使用的内存块中所有对象,交换两个内存块的角色,完成垃圾回收。

  技术分享图片

  由此可见,复制算法最大的问题是空间浪费。Java中实际应用做了一些优化(分代思想,下面介绍),示例图如下:

技术分享图片

  新生代总空间为15M,但可用空间只有13824K。其中12288K为eden区空间,主要存放新产生的对象,1536K为新生代两块相同空间(幸存代中from区和to区)中其中一块。

技术分享图片

三、分代思想:

  1、依据对象的存活周期进行分类,短命对象归为新生代,长命对象归为老年代;

  2、根据不同代的特点,选取合适的GC算法,少量对象存活,适合复制算法;大量对象存活,适合标记清理或者标记压缩。

 四、可触及性:

  所有的算法需要能够识别一个垃圾对象,因此引入了可触及性的概念。

  1、可触及的:从根节点可以触及到的对象;

  2、可复活的:一旦所有引用都被释放,就是可复活状态;因为有可能在finalize()方法中可能复活该对象;

  3、不可触及的:在finalize()方法后,可能会进入不可触及状态,不可触及的对象不可能被复活,此时可以被GC回收。

  对象状态转换如下:

  1)首先定义一个可复活对象,在finalize()方法中复活一个对象:

public class CanReliveObj {
	public static CanReliveObj obj;
	@Override
	protected void finalize() throws Throwable {
	    super.finalize();
	    System.out.println("CanReliveObj finalize called");
	    obj=this;
	}
	@Override
	public String toString(){
	    return "I am CanReliveObj";
	}
}

  2)主函数方法如下:

public static void main(String[] args) throws
     InterruptedException{
  obj=new CanReliveObj();
  obj=null;   //可复活
  System.gc();
  Thread.sleep(1000);
  if(obj==null){
      System.out.println("obj 是 null");
  }else{
      System.out.println("obj 可用");
  }
  System.out.println("第二次gc");
  obj=null;    //不可复活
  System.gc();
  Thread.sleep(1000);
  if(obj==null){
    System.out.println("obj 是 null");
  }else{
    System.out.println("obj 可用");
  }
}

  3)运行结果如下:

CanReliveObj finalize called
obj 可用
第二次gc
obj 是 null

  注意,如果在调用finalize()方法后忘记释放内存,那么可复活对象就会一直存在于堆内存中,很容易造成内存溢出,因此是有风险的。在编码的时候要注意以下几点:

  1)避免使用finalize()方法,操作不慎可能导致错误;

  2)优先级很低,因为我们不知道也无法明确GC什么时候发生,使用finalize()方法反而增加了程序的不确定性;

  3)可以使用try-catch-finally来代替finalize()方法。

五、根对象

  什么是根对象呢?主要有以下三类:

  1、栈中引用的对象;

  2、方法区静态成员或者常量引用的对象(全局变量);

  3、JNI方法栈中引用的对象。

六、STOP-THE-WORLD

  STOP-THE-WORLD是Java中一种全局停顿的现象,此时所有Java代码停止运行,native方法可以运行但是无法与jvm发生交互,发生这种情况多半是由于GC引起的。另外Dump检查、死锁检查、堆Dump也有可能引起。

  1、GC为什么会引起全局停顿?

  类比在聚会时打扫卫生,聚会时很乱,又会产生新的垃圾,房间永远不会被打扫干净,只有暂停一下聚会才会将房间打扫干净。

  2、全局停顿的危害

  长时间停止服务,没有响应;对于HA系统可能会引起主备切换。

  3、写一个测试demo验证STOP-THE-WORLD的存在

  1)声明一个线程,每过1s打印10条记录;

public static class PrintThread extends Thread{
	public static final long starttime=System.currentTimeMillis();
	@Override
	public void run(){
		try{
			while(true){
				long t=System.currentTimeMillis()-starttime;
				System.out.println("time:"+t);
				Thread.sleep(100);
			}
		}catch(Exception e){
			
		}
	}
}

  2)声明另外一个线程消耗资源,用来触发GC(不断的占用内存,不断的释放变量来触发GC)

public static class MyThread extends Thread{
	HashMap<Long,byte[]> map=new HashMap<Long,byte[]>();
	@Override
	public void run(){
		try{
			while(true){
				if(map.size()*512/1024/1024>=450){
					System.out.println(“=====准备清理=====:"+map.size());
					map.clear();
				}
				
				for(int i=0;i<1024;i++){
					map.put(System.nanoTime(), new byte[512]);
				}
				Thread.sleep(1);
			}
		}catch(Exception e){
			e.printStackTrace();
		}
	}
}

  3)启动JVM的参数为512m堆空间、串行回收器

-Xmx512M -Xms512M -XX:+UseSerialGC -Xloggc:gc.log -XX:+PrintGCDetails  -Xmn1m -XX:PretenureSizeThreshold=50 -XX:MaxTenuringThreshold=1

  4)观察控制台输出和GC日志,开始是1s打印10条记录,后来产生了全局停顿。

技术分享图片技术分享图片

  GC发生的时间与全局停顿的时间是吻合的。

 

 

  

  

  

 

 

 

 

 

  

 

 

 

 

 

 

 

  

  


以上是关于深入探究jvm之GC的算法及种类的主要内容,如果未能解决你的问题,请参考以下文章

深入探究JVM之垃圾回收器

JVM学习十:JVM之垃圾收集器及GC参数

JVM技术指南「GC本质底层机制」SafePoint的深入分析和底层原理探究指南

JVM深层系列「GC本质底层机制」SafePoint的深入分析和底层原理探究指南

JVM之GC算法解读

直通BAT JVM必考题:Minor GCMajor GCFull GC的区别