垃圾收集算法

Posted 2020-12-14 yzhengy

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了垃圾收集算法相关的知识，希望对你有一定的参考价值。

垃圾回收的作用区域在Java堆和方法区。

如何确定对象已死（如何确定垃圾）

1.引用计数算法：在对象中添加一个引用计数器，每当有一个地方引用它，计数器值就加1；当引用失效，计数器值就减1；
                  任何时刻计数器为零的对象就是不可能再被使用的。
	优缺点：这个看似简单的算法有很多例外情况要考虑，必须要配合大量额外处理才能保证正确地工作，譬如单纯的引用计数 
                  就很难解决对象之间相互循环引用的问题。所以主流的Java虚拟机里面都没有选用引用计数算法来管理内存。

2.可达性分析算法：通过一系列“GC Roots”根对象作为起始节点集，从这些节点开始，根据引用关系向下搜索，搜索过程所走过的路径称为“引用链”，
               如果某个对象到GC Roots间没有任何引用链相连，或者用图论的话来说就是从GC Roots到这个对象不可达时，则证明此对象是不可能再被使用的。
	固定可作为GC Roots的对象：
		1.在虚拟机栈中引用的对象
		2.方法区中类静态属性引用的对象
		3.方法区中常量引用的对象
		4.本地方法栈中JNI引用的对象
		5.Java虚拟机内部的引用
		6.所有被同步锁（Synchronized）持有的对象
		7.反映Java虚拟机内部情况的JMXBean、JVMTI中注册的回调、本地代码缓存等
除了这些固定的GC Roots集合以外，根据用户所选用的垃圾收集器以及当前回收的内存区域不 同，还可以有其他对象“临时性”地加入，共同构成完整GC Roots集合。

引用

Java将引用分为强引用、软引用、弱引用和虚引用。这四种引用强度依次逐渐减弱。

	1.强引用：指在程序代码之中普遍存在的引用赋值，无论任何情况下，只要强引用关系还存在，垃圾收集器就永远不会回收掉被引用的对象。

	2.软引用：用来描述一些还有用，但非必须的对象。只被软引用关联着的对象，在系统将要发生内存溢出异常前，会把这些对象列进回收范围之中进行第二次回收，如果这次回收还没有足够的内存，才会抛出内存溢出异常。

	3.弱引用：是用来描述非必须对象，它的强度比软引用更弱一些，被弱引用关联的对象只能生存到下一次垃圾收集发生为止。当垃圾收集器开始工作，无论当前内存是否足够，都会回收掉只被弱引用关联的对象。

	4.虚引用：是最弱的一种引用关系。一个对象是否有虚引用的存在，完全不会对其生存时间构成影响，也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的是为了能在这个对象被收集器回收时收到一个系统通知。

软引用的应用场景：
技术图片

一个对象真正死亡

真正宣告一个对象死亡，至少要经历两次标记过程：
如果对象在进行可达性分析后发现没有与GC Roots相连接的引用链，那它将会被第一次标记，随后进行一次筛选，筛选的条件是此对象是否有必要执行finalize()方法。假如对象没有覆盖finalize()方法，或者finalize()方法已经被虚拟机调用 过，那么虚拟机将这两种情况都视为“没有必要执行”。
如果这个对象被判定为确有必要执行finalize()方法，那么该对象将会被放置在一个名为F-Queue的队列之中，并在稍后由一条由虚拟机自动建立的、低调度优先级的Finalizer线程去执行它们的finalize() 方法。finalize()方法是对象逃脱死亡命运的最后一次机会，稍后收集器将对F-Queue中的对象进行第二次小规模的标记，如果对象要在finalize()中成功拯救自己：只要重新与引用链上的任何一个对象建立关联即可，譬如把自己赋值给某个类变量或者对象的成员变量，那在第二次标记时它将被移出“即将回收”的集合；如果对象这时候还没有逃脱，那基本上它就真的要被回收了。

回收方法区

方法区的垃圾收集主要回收两部分内容：废弃的常量和不再使用的类型。
判定一个常量是否“废弃”还是相对简单，而要判定一个类型是否属于“不再被使用的类”的条件就比较苛刻了。需要同时满足下面三个条件：
1.该类所有的实例都已经被回收，也就是Java堆中不存在该类及其任何派生子类的实例。
2.加载该类的类加载器已经被回收。
3.该类对应的java.lang.Class对象没有在任何地方被引用，无法在任何地方通过反射访问该类的方法。
Java虚拟机被允许对满足上述三个条件的无用类进行回收，仅仅是“被允许”，并不是和对象一样，没有引用了就必然会回收。

垃圾收集算法

? 把分代收集理论具体放到现在的商用Java虚拟机里，设计者一般至少会把Java堆划分为新生代和老年代两个区域。顾名思义，在新生代中，每次垃圾收集时都发现有大批对象死去，而每次回收后存活的少量对象，将会逐步晋升到老年代中存放。

1.引用计数法

? 在对象中添加一个引用计数器，每当有一个地方引用它，计数器值就加1；当引用失效，计数器值就减1；任何时刻计数器为零的对象就是不可能再被使用的。

? 缺点：每次对对象赋值时要维护引用计数器，且计数器本身也有一定的损耗；较难处理循环引用。

2.标记-清除算法

? 算法分为“标记”和“清除”两个阶段：首先标记出所有需要回收的对象，在标记完成后，统一回收掉所有被标记的对象，也可以反过来，标记存活的对象，统一回收所有未被标记的对象。标记过程就是对象是否属于垃圾的判定过程。

? 缺点：1.执行效率不稳定，标记和清除两个过程的执行效率都随对象数量增长而降低。

? 2.内存空间的碎片化问题。

技术图片

3.标记-复制算法（解决清除算法效率低）

--半区复制：它将可用内存按容量划分为大小相等的两块，每次只使用其中的一块。当这一块的内存用完了，就将还存活着的对象复制到另外一块上面，然后再把已使用过的内存空间一次清理掉。如果内存中多数对象都是存活的，这种算法将会产生大量的内存间复制的开销，但对于多数对象都是可回收的情况，算法需要复制的就是占少数的存活对象，而且每次都是针对整个半区进行内存回收，分配内存时也就不用考虑有空间碎片的复杂情况，只要移动堆顶指针，按顺序分配即可。

? 缺点：将可用内存缩小为了原来的一半，空间浪费太多了。

技术图片

--Appel式回收：把新生代分为一块较大的Eden空间和两块较小的Survivor空间，每次分配内存只使用Eden和其中一块Survivor。发生垃圾搜集时，将Eden和Survivor中仍然存活的对象一次性复制到另外一块Survivor空间上，然后直接清理掉Eden和已用过的那块Survivor空间。HotSpot虚拟机默认Eden和Survivor的大小比例是8∶1，也即每次新生代中可用内存空间为整个新生代容量的90%（Eden的80%加上一个Survivor的10%），只有一个Survivor空间，即10%的新生代是会被“浪费”的。当然，98%的对象可被回收仅仅是“普通场景”下测得的数据，任何人都没有办法百分百保证每次回收都只有不多于10%的对象存活，因此Appel式回收还有一个充当罕见情况的“逃生门”的安全设计，当Survivor空间不足以容纳一次Minor GC之后存活的对象时，就需要依赖其他内存区域（大多是老年代）进行分配担保。

4.标记-整理算法（解决老年代不能使用复制）

算法的标记过程仍然与“标记-清除”算法一样，但后续步骤不是直接对可回收对象进行清理，而是让所有存活的对象都向内存空间一端移动，然后直接清理掉边界以外的内存。

是否移动对象都存在弊端，移动则内存回收时会更复杂，不移动则内存分配时会更复杂。从垃圾收集的停顿时间来看，不移动对象停顿时间会更短，甚至可以不需要停顿，但是从整个程序的吞吐量来看，移动对象会更划算。

技术图片

以上是关于垃圾收集算法的主要内容，如果未能解决你的问题，请参考以下文章