走进JVM之GC

向代码致敬,寻找你的第[83]行。

Posted by MatthewHan on 2020-09-22

GC知识点

主要分三个部分:

  1. 如何判断该对象要回收(是垃圾)
  2. 回收的算法有哪些?
  3. 垃圾收集器

判断一个对象是否可以回收

1. 引用计数法

Python采用该种算法,但是解决了相互引用的问题

为对象添加一个引用计数器,当对象增加一个引用时计数器加 1,引用失效时计数器减 1。引用计数为 0 的对象可被回收。

在两个对象出现循环引用的情况下,此时引用计数器永远不为 0,导致无法对它们进行回收。正是因为循环引用的存在,因此 Java 虚拟机不使用引用计数算法。

2. GC root(可达性算法)

gc root

从GCroot出发遍历,标记每个可访达的对象为活动对象,遍历不到的对象(Obj4)就会被接下来要讲的几种算法回收了。

GC root可以是以下几种:

  • Java 方法栈桢中的局部变量;
  • 已加载类的静态变量;
  • JNI handles;
  • 已启动且未停止的 Java 线程。

多线程环境下,会产生误报和漏报。

误报:A线程修改了访问,B线程会导致垃圾也被标记了,不会被清除,造成内存浪费。

漏报:将仍被应用的对象标记为垃圾。

误报和漏报的理解:误报大不了不回收嘛,漏报比较严重。垃圾回收是先标记活的对象,后回收死的对象,那么如果标记好后,其它线程产生了垃圾,即将活的变死了,这种内存是不会释放的。另外,如果这时产生了新对象,由于没被标记为活的,所以被释放了,这就危险了。

Q:如何解决?(实际JVM虚拟机并不会出现这种情况)

A:Stop-the-world 以及安全点(安全词),垃圾回收线程工作时,其他非垃圾回收线程一律等待!

垃圾回收算法

1.标记 - 清除算法

利用GC root遍历到的标记(非垃圾),那么其余的就是垃圾了,直接把剩下的对象标记为空闲内存

清除

  • 优点:标记和清除的过程效率不高
  • 缺点:产生大量不连续碎片,就无法给大内存的对象分配空间了

2.标记 - 整理算法(压缩算法)

即把存活的对象聚集到内存区域的起始位置,从而留下一段连续的内存空间。

  • 优点:结果是很美好的,拥有了连续的内存空间,所以一般老年代使用该种算法,因为老年代的频率明显比新生代低很多。
  • 缺点:性能拉胯,毕竟要移动。(让我想到了为么MySQL用b+树,而不用有序数组,因为数据量大的时候插入、删除、移动的效率太低下了)

压缩

3.复制算法

将内存划分为大小相等的两块(Java8的中S0、S1),每次只使用其中一块,当这一块内存用完了就将还存活的对象复制到另一块上面,然后再把使用过的内存空间进行一次清理。(有点像数组的System.arraycopy,利用from和to两个指针)。

所以所谓的S0和S1是相互复制然后全标记的,都会成为「空」的空间和复制来的对象的空间。

主要的不足是每次S0和S1肯定有一块是空的,为了接下来的复制,所以也算是小浪费。

HotSpot 虚拟机的 Eden 和 Survivor 大小比例默认为 8:1,保证了内存的利用率达到 90%。如果每次回收有多于 10% 的对象存活,那么一块 Survivor 就不够用了,此时需要依赖于老年代进行空间分配担保,也就是借用老年代的空间存储放不下的对象。

复制算法

4.分代收集算法

现在的商业虚拟机采用分代收集算法,它根据对象存活周期将内存划分为几块,不同块采用适当的收集算法。

一般将堆分为新生代和老年代。

  • 新生代使用:复制算法
  • 老年代使用:标记 - 清除 或者 标记 - 整理 算法

5.总结 内存

先Minor GC(Young GC),再Major GC(Full GC)。S0/S1交换14次后晋升至老年代(Java8之后是元空间,位于本地内存),jvm默认值是15。

一般来说OOM是内存耗尽,也有超大内存(不多)的情况。

gc-flow

以上是我画的图,其中少了一步,当新生代晋升至老年代的时候失败怎么办?其实这里是执行Major GC,也就是走下面的那条流程。

垃圾收集器

可以简单理解成新生代搞一个收集器,老年代搞一个收集器,Java8默认的就是Parallel + Parallel Old收集器

  1. 串行回收:Serial GC

  2. 并行回收:Parallel GC:吞吐量高(因为并行,花费GC的时间少,所以可以让出时间给其他非GC线程),适用于科学计算

  3. 并发回收:CMS(ConcMarkSweep,并发标记清除):其实有STW,也有并行。后备方案是Serial Old。而且是标记清除,会有碎片,会导致提前Major GC;吞吐量低,但是适用是高并发、快速响应的场景。

    CMS

  4. Java9之后的:G1,Java11之后的:ZGC(在G1基础上),使命就是为了替换CMS。

垃圾回收器

JVM调优配了新生代,老年代会跟着配对应的垃圾收集器。

除了以上4种,主要还有以下3种:

  1. Serial Old(已废弃)

  2. ParNew

  3. ParOld

    ParOld

参数 新生代 新生代算法 老年代(元空间) 老年代算法
-xx:+UseSerialGC Serial 复制 Serial old 标记整理
-xx:+UseParNewGC ParNew 复制 Serial old 标记整理
-xx:+UseParallelGC Parallel 复制 Parallel old 标记整理
-xx:+UseConcMarkSweepGC ParNew 复制 CMS / Serial old 标记清除
-xx:+UseG1GC G1 不区别新老年代,整体是标记整理 局部是赋值算法

G1和CMS的区别:

  1. G1分块设计,会移动不同的内存对象。G1虽然是标记清除算法,但是不会产生碎片

  2. G1可以设置STW的时间,假如设置太小,就会频繁GC,降低吞吐量