java底层知识GC相关

Posted dasha

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java底层知识GC相关相关的知识,希望对你有一定的参考价值。

 

GC简单的了解

GC:Garbage Collection 字面意思是垃圾回收器,释放垃圾占用的内存空间。让创建的对象不需要像c、c++那样delete、free掉。对于c、c++的开发人员分配的,也就是说还要对内存进行维护和释放。对于java程序员来说,一个对象的内存分配是在虚拟机的自动分配机制的帮助下,不再需要为每一个new操作去写配对的delete/free代码,而且不容易出现内存泄漏和内存溢出的问题,但是,如果出现了内存泄漏和内存溢出问题,而开发者又不了解虚拟机怎么分配内存的话,那么定位错误和排除错误将是一件很痛苦的事。

jvm内存管理结构,如图

技术图片

 

JVM运行时数据区

  • 程序计数器(Program Counter Register):程序计数器是用于存储每个线程下一步执行的JVM指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。每条线程都需要有一个独立的程序计数器,各条线程之间的计数器互不影响,独立存储,故称该区域为“线程私有内存”
  • JVM栈(JVM stack):与程序计数器一样,Java虚拟机栈也是线程私有的,它的生命周期与线程相同。虚拟机栈描述的是Java方法执行的内存模型;每个方法被执行的时候都会同时创建一个栈帧用于存储局部变量表,操作栈,动态链接,方法出口等信息。每个方法被调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。
    局部变量表存放了编译期可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)、非基本类型的对象在JVM栈上仅存放一个指向堆上的地址。
  • Java堆(Head):对于大多数应用来说,Java堆是Java虚拟机所管理的内存中最大的一块。Java堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。此区域的唯一目的就是存放对象的实例,几乎所有的对象实例都在这里分配内存。
    Java堆是垃圾收集器管理的主要区域,因此很多时候也被称作“GC堆”。如果从内存回收的角度看,由于现在收集器基本上都采用分代收集算法,所以Java堆中还可以细分为 :新生代和老年代;再细分一点新生代有Eden空间、From Survivor空间、To Survivor空间等。
    根据Java虚拟机规范规定,Java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可,就像我们的磁盘空间一样,在实现时,既可以实现成固定大小的,也可以是可扩展的,不过当前主流的虚拟机都是按照可扩展来实现的(通过-Xmx和-Xms控制)。一般设置成同样大小,以避免每次垃圾回收完成后JVM重新分配内存,引起性能问题。如果在堆中没有内存完成实例分配,并且无法再扩展时,将会抛出OutOfMemoryError异常
  • 方法区(Method Area):方法区与Java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做Non-Heap(非堆),目的应该是与Java堆区分开来。对于习惯在HotSpot虚拟机上开发和部署程序的开发者来说,很多人愿意把方法区称为“永久代”(Permanent Generation),本质上两者并不等价,仅仅是因为HotSpot虚拟机的设计团队选择吧GC分代收集扩展至方法区,或者说使用永久代来实现方法区而已。
    此区域内存不够时我们会得到:java.lang.OutOfMemoryError: PermGen错误。而在JDK8中发生了明显的变化,就是一般情况下不会得到这个错误,原因是在于JDK8中把存放元数据中的永久代从堆内存中移到了本地内存。这样永久代就不再占用堆内存,当然JDK8也提供了一个新的设置Matespace内存大小的参数,通过这个参数可以设置Matespace内存大小,这样我们可以根据自己项目的实际情况,避免过度浪费本地内存,达到有效利用。

    -XX:MaxMetaspaceSize=128m 设置最大的元内存空间128兆

 

对象被判定为垃圾的标准

1、没有被其他对象引用

判定对象是否为垃圾的算法

1、引用计数算法

判断对象的引用数量

1)、通过判断对象的引用数量来决定对象是否可以被回收

2)、每个对象实例都有一个引用计数器,被引用则+1,完成引用-1

3)、任何引用数为0的对象实例可以被当做垃圾收集

优点:执行效率高,程序执行受影响较小

缺点:无法检测出循环引用的情况,导致内存泄漏

2、可达性分析算法

通过判断对象的引用链是否可达来决定对象是否可以被回收

技术图片

可以作为GC ROOT的对象:

1)、虚拟机栈中引用的对象(栈帧中的本地变量表)

2)、方法区中的常量引用的对象

3)、方法区中的类静态属性引用的对象

4)、本地方法栈中JNI(native方法)的引用对象

5)、活跃线程的引用对象

垃圾回收算法

1、标记-清除算法

  最基础的收集算法,算法分为“标记”和“清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统计回收所有被被标记的对象。

  缺点:

  • 标记和清除两个过程效率都不高。
  • 空间问题,标记清除后会产生大量不连续的内存碎片,碎片太多可能会导致以后在程序运行过程中需要分配大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。

技术图片

 

 

2、复制算法

  为了解决效率问题,一种称为“复制”(Copying)的收集算法出现了,它将可用的内存按容量划分为大小相等的两块,每次只使用其中的一块,当这块内存用完了,就将还存活着的对象复制到另一块上面,然后再把已使用过的内存空间一次清理掉。这样使得每次都是对整个半区进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。只是这种算法的代价是将内存缩小为原来的一半,未免太高了一点。新生代GC算法采用的就是这种算法。Hotspot虚拟机默认为Eden和Survivor的比例是8:1:1。

技术图片

 

3、标记-整理算法

  复制收集算法在对象存活率较高时就要进行较多的复制操作,效率将会变低。更关键的是,如果不想浪费50%的空间,就需要有额外的空间进行分配担保,以应对被使用的内存中所有对象都100%存活的极端情况,所以在老年代一般不能直接使用这种算法。
  根据老年代的特点,有人提出了另外一种“标记-整理”(Mark-Compact)算法,标记过程仍然与“标记-清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存,“标记-整理”算法如图

技术图片

 

4、分代收集算法

  当前商业虚拟机的垃圾收集都采用“分代收集”算法,这种算法并没有什么新的思想,只是根据对象存活周期的不同将内存划分为几块,一般是把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高,没有额外空间对它进行分配担保,就必须使用“标记-清理”或者“标记-整理”算法来进行回收。

 

以上是关于java底层知识GC相关的主要内容,如果未能解决你的问题,请参考以下文章

Java Web架构知识整理——记一次阿里面试经历

Java Web架构知识整理——记一次阿里面试经历

极客时间-左耳听风-程序员攻略-Java底层知识

Java面试之Offer直通车视频课程

Java底层知识:什么是 “桥接方法” ?

Java知识体系Java并发编程进阶,多线程和锁底层原理探究