JVM-垃圾收集器

前言

如果说收集算法是内存回收的方法论，那么垃圾收集器就是内存回收的具体实现。

Java虚拟机规范中对垃圾收集器应该如何实现并没有任何规定，因此不同的厂商、不同版本的虚拟机所提供的垃圾收集器都可能会有很大差别，并且一般都会提供参数供用户根据自己的应用特点和要求组合出各个年代所使用的收集器。

以下讨论的收集器基于JDK 1.7 的 HotSpot 虚拟机，这个虚拟机包含的所有收集器如下图所示：

上图展示了7种作用于不同分代的收集器，如果两个收集器之间存在连线，就说明它们可以搭配使用。

在介绍这些收集器各自的特性之前，我们先来明确一个观点：虽然我们是在对各个收集器进行比较，但并非为了挑选出一个最好的收集器。因为直到现在为止还没有最好的收集器出现，更加没有万能的收集器，所以我们选择的只是对具体应用最合适的收集器。

各收集器对比：

| 收集器 | 新生代/老年代 | 收集算法 | 单线程/多线程 |特点 |
| -------- | :------: | :------: |:------: |:------: |
| Serial 收集器 | 新生代 | 复制算法 | 单线程 | |
| ParNew 收集器 | 新生代 | 复制算法 | 多线程 | |
| Parallel Scavenge 收集器 | 新生代 | 复制算法 | 多线程 | 吞吐量 |
| Serial Old 收集器 | 老年代 | 标记-整理算法 | 单线程 | |
| Parallel Old 收集器 | 老年代 | 标记-整理算法 | 多线程 | 吞吐量 |
| CMS 收集器 | 老年代 | 标记—清除算法 | 多线程 | 追求最短停顿时间 |
| G1 收集器 | 老年代 | 标记—整理算法 | 多线程 | 追求最短停顿时间，空间整合，预测停顿 |

JDK默认垃圾收集器

jdk1.7， jdk1.8 默认垃圾收集器 Parallel Scavenge（新生代）+ Parallel Old（老年代）

命令：

查看程序使用的默认JVM参数： java -XX:+PrintCommandLineFlags -version

[root@izwz94patu9j43n9tesjkbz ~]# java -XX:+PrintCommandLineFlags -version
-XX:InitialHeapSize=524487232 -XX:MaxHeapSize=8391795712 -XX:+PrintCommandLineFlags -XX:+UseCompressedClassPointers -XX:+UseCompressedOops -XX:+UseParallelGC 
java version "1.8.0_151"
Java(TM) SE Runtime Environment (build 1.8.0_151-b12)
Java HotSpot(TM) 64-Bit Server VM (build 25.151-b12, mixed mode)

查看GC详情： java -XX:+PrintGCDetails -version

[root@izwz94patu9j43n9tesjkbz ~]# java -XX:+PrintGCDetails -version
java version "1.8.0_151"
Java(TM) SE Runtime Environment (build 1.8.0_151-b12)
Java HotSpot(TM) 64-Bit Server VM (build 25.151-b12, mixed mode)
Heap
 PSYoungGen      total 150016K, used 5161K [0x0000000719400000, 0x0000000723b00000, 0x00000007c0000000)
  eden space 129024K, 4% used [0x0000000719400000,0x000000071990a558,0x0000000721200000)
  from space 20992K, 0% used [0x0000000722680000,0x0000000722680000,0x0000000723b00000)
  to   space 20992K, 0% used [0x0000000721200000,0x0000000721200000,0x0000000722680000)
 ParOldGen       total 343040K, used 0K [0x00000005cbc00000, 0x00000005e0b00000, 0x0000000719400000)
  object space 343040K, 0% used [0x00000005cbc00000,0x00000005cbc00000,0x00000005e0b00000)
 Metaspace       used 2226K, capacity 4480K, committed 4480K, reserved 1056768K
  class space    used 243K, capacity 384K, committed 384K, reserved 1048576K

名词解释 - 并行和并发

并行（Parallel）：指多条垃圾收集线程并行工作，但此时用户线程仍然处于等待状态。

并发（Concurrent）：指用户线程与垃圾收集线程同时执行（但不一定是并行的，可能会交替执行），用户程序在继续运行，而垃圾收集程序运行于另一个CPU上。

一，Serial 收集器

Serial 收集器是最基本、发展历史最悠久的收集器，曾经（在JDK 1.3.1之前）是虚拟机新生代收集的唯一选择。Serial 收集器是单线程的，使用复制算法，更重要的是在它进行垃圾收集的时候，必须暂停其它所有的工作线程(STW : Stop The World)，知道它收集结束。

Serial/Serial Old收集器运行示意图：

它依然是虚拟机运行在 Client 模式下 的默认新生代收集器。它也有着优于其他收集器的地方：简单而高效（与其他收集器的单线程比），对于限定单个 CPU 的环境来说，Serial 收集器由于没有线程交互的开销，专心做垃圾收集自然可以获得最高的单线程收集效率。

二，ParNew 收集器

ParNew 收集器就是 Serial 收集器的多线程版本。其行为包括 Serial 收集器可用的所有控制参数、收集算法（复制算法）、Stop The World、对象分配规则、回收策略等都与 Serial 收集器完全一样，在实现上，这两种收集器也共用了相当多的代码。

它默认开启的收集线程数与 CPU 的数量相同，在CPU非常多的环境下，可以使用 -XX:ParallelGCThreads 参数来限制垃圾收集的线程数。

ParNew/Serial Old收集器运行示意图：

它是许多运行在 **Server 模式下**的虚拟机中首选的新生代收集器，其中有一个与性能无关但很重要的原因是，除了 Serial 收集器外，目前只有它能与CMS收集器配合工作。 CMS 收集器（Concurrent Mark Sweep），这款收集器是 HotSpot 虚拟机中第一款真正意义上的并发（Concurrent）收集器，它第一次实现了让垃圾收集线程与用户线程（基本上）同时工作。

三，Parallel Scavenge 收集器

Parallel Scavenge 收集器是一个新生代收集器，它也是使用复制算法的收集器，又是并行的多线程收集器。

Parallel Scavenge 收集器的特点是它的关注点与其他收集器不同，CMS 等收集器的关注点是尽可能地缩短垃圾收集时用户线程的停顿时间，而 Parallel Scavenge 收集器的目标则是达到一个可控制的吞吐量 Throughput。

所谓吞吐量就是CPU用于运行用户代码的时间与 CPU 总消耗时间的比值，即吞吐量 = 运行用户代码时间 /（运行用户代码时间 +垃圾收集时间），虚拟机总共运行了100分钟，其中垃圾收集花掉1分钟，那吞吐量就是99%。高吞吐量则可以高效率地利用 CPU 时间，尽快完成程序的运算任务，主要适合在后台运算而不需要太多交互的任务。

Parallel Scavenge 收集器提供了两个参数用于精确控制吞吐量，分别是控制最大垃圾收集停顿时间的 -XX:MaxGCPauseMillis 参数以及直接设置吞吐量大小的 -XX:GCTimeRatio 参数。

GC自适应的调节策略

除上述两个参数之外，Parallel Scavenge 收集器还有一个参数 -XX:+UseAdaptiveSizePolicy 值得关注。这是一个开关参数，当这个参数打开之后，就不需要手工指定新生代的大小（-Xmn）、Eden 与 Survivor 区的比例（-XX:SurvivorRatio）、晋升老年代对象年龄（-XX:PretenureSizeThreshold）等细节参数了，虚拟机会根据当前系统的运行情况收集性能监控信息，动态调整这些参数以提供最合适的停顿时间或者最大的吞吐量，这种调节方式称为GC自适应的调节策略（GC Ergonomics)。

只需要把基本的内存数据设置好（如-Xmx设置最大堆），然后使用 MaxGCPauseMillis 参数（更关注最大停顿时间）或 GCTimeRatio （更关注吞吐量）参数给虚拟机设立一个优化目标，那具体细节参数的调节工作就由虚拟机完成了。自适应调节策略也是 Parallel Scavenge 收集器与ParNew收集器的一个重要区别。

四，Serial Old 收集器

Serial Old 是 Serial 收集器的老年代版本，它同样是一个单线程收集器，使用标记-整理算法。

这个收集器的主要意义也是在于给Client模式下的虚拟机使用。

Serial/Serial Old收集器运行示意图:

五，Parallel Old 收集器

Parallel Old 是 Parallel Scavenge 收集器的老年代版本，使用多线程和标记-整理算法。

这个收集器是在 JDK 1.6中才开始提供的。在 JDK1.6之前，Parallel Scavenge 收集器只能与 Serial Old 搭配，由于老年代 Serial Old 收集器在服务端应用性能上的“拖累”，使用了 ParallelScavenge 收集器也未必能在整体应用上获得吞吐量最大化的效果，由于单线程的老年代收集中无法充分利用服务器多 CPU 的处理能力，在老年代很大而且硬件比较高级的环境中，这种组合的吞吐量甚至还不一定有 ParNew 加 CMS 的组合“给力”。

直到 JDK 1.6 Parallel Old收集器出现后，吞吐量优先收集器终于有了比较名副其实的应用组合，在注重吞吐量以及CPU资源敏感的场合，都可以优先考虑 Parallel Scavenge 加 Parallel Old收集器。

Parallel Scavenge/Parallel Old收集器运行示意图:

六，CMS 收集器

CMS （Concurrent Mark Sweep）收集器是一种以获取最短回收停顿时间为目标的收集器。

从名字（包含“Mark Sweep”）上就可以看出，CMS收集器是基于标记—清除算法实现的，它的运作过程相对于前面几种收集器来说更复杂一些。

`6.1 CMS 收集器运作过程`

整个过程分为4个步骤，包括：

① 初始标记：（STW）仅仅只是标记一下 GC Roots能直接关联到的对象，速度很快。

② 并发标记：进行 GC Roots Tracing 的过程。

③ 重新标记：（STW）为了修正并发标记期间因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录。

④ 并发清除

由于整个过程中耗时最长的并发标记和并发清除过程收集器线程都可以与用户线程一起工作，所以，从总体上来说，CMS收集器的内存回收过程是与用户线程一起并发执行的。

下图可以比较清楚地看到CMS收集器的运作步骤中并发和需要停顿的时间：

`6.2 CMS 收集器缺点`

CMS还远达不到完美的程度，它有以下3个明显的缺点：

6.2.1 对CPU资源非常敏感：

其实，面向并发设计的程序都对CPU资源比较敏感。在并发阶段，它虽然不会导致用户线程停顿，但是会因为占用了一部分线程（或者说CPU资源）而导致应用程序变慢，总吞吐量会降低。

CMS默认启动的回收线程数是（CPU数量+3）/ 4，也就是当CPU在4个以上时，并发回收时垃圾收集线程不少于25%的CPU资源，并且随着CPU数量的增加而下降。但是当CPU不足4个时，CMS对用户程序的影响就可能变得很大，如果本来CPU负载就比较大，还分出一半的运算能力去执行收集器线程，就可能导致用户程序的执行速度忽然降低了50%，其实也让人无法接受。

6.2.2 无法处理浮动垃圾：

CMS收集器无法处理浮动垃圾（Floating Garbage），可能出现“Concurrent ModeFailure”失败而导致另一次Full GC的产生。

由于CMS并发清理阶段用户线程还在运行着，伴随程序运行自然就还会有新的垃圾不断产生，这一部分垃圾出现在标记过程之后，CMS无法在当次收集中处理掉它们，只好留待下一次GC时再清理掉。这一部分垃圾就称为“浮动垃圾”。

在 JDK 1.5的默认设置下，CMS 收集器当老年代使用了 68% 的空间后就会被激活，这是一个偏保守的设置，如果在应用中老年代增长不是太快，可以适当调高参数 -XX:CMSInitiatingOccupancyFraction 的值来提高触发百分比，以便降低内存回收次数从而获取更好的性能，在JDK 1.6中，CMS 收集器的启动阈值已经提升至 92%。要是 CMS 运行期间预留的内存无法满足程序需要，就会出现一次 “Concurrent Mode Failure” 失败，这时虚拟机将启动后备预案：临时启用Serial Old收集器来重新进行老年代的垃圾收集，这样停顿时间就很长了。所以说参数-XX:CM SInitiatingOccupancyFraction设置得太高很容易导致大量 “Concurrent Mode Failure” 失败，性能反而降低。

6.2.3 大量空间碎片产生：

CMS是一款基于“标记—清除”算法实现的收集器，就可能想到这意味着收集结束时会有大量空间碎片产生。

空间碎片过多时，将会给大对象分配带来很大麻烦，往往会出现老年代还有很大空间剩余，但是无法找到足够大的连续空间来分配当前对象，不得不提前触发一次 Full GC。

为了解决这个问题，CMS收集器提供了一个 -XX:+UseCMSCompactAtFullCollection 开关参数（默认就是开启的），用于在 CMS 收集器顶不住要进行 FullGC 时开启内存碎片的合并整理过程，内存整理的过程是无法并发的，空间碎片问题没有了，但停顿时间不得不变长。

七，G1 收集器

G1 是一款面向服务端应用的垃圾收集器。它就被视为JDK 1.7 中 HotSpot 虚拟机的一个重要进化特征。HotSpot 开发团队赋予它的使命是（在比较长期的）未来可以替换掉 JDK 1.5 中发布的 CMS 收集器。

`7.1 G1 收集器特点`

与其他 GC 收集器相比，G1 具备如下特点：

并行与并发：G1 能充分利用多 CPU、多核环境下的硬件优势，使用多个 CPU（CPU或者CPU核心）来缩短 Stop-The-World 停顿的时间。

分代收集

空间整合：G1 从整体来看是基于“标记—整理”算法实现的收集器，从局部（两个 Region 之间）上来看是基于“复制”算法实现的，但无论如何，这两种算法都意味着 G1 运作期间不会产生内存空间碎片，收集后能提供规整的可用内存。这种特性有利于程序长时间运行，分配大对象时不会因为无法找到连续内存空间而提前触发下一次 GC。

可预测的停顿：这是 G1 相对于 CMS 的另一大优势，G1 除了追求低停顿外，还能建立可预测的停顿时间模型，能让使用者明确指定在一个长度为M毫秒的时间片段内，消耗在垃圾收集上的时间不得超过N毫秒，这几乎已经是实时Java（RTSJ）的垃圾收集器的特征了。

使用 G1 收集器时，Java 堆的内存布局就与其他收集器有很大差别，它将整个Java堆划分为多个大小相等的独立区域 Region，Region 之间的对象引用以及其他收集器中的新生代与老年代之间的对象引用，虚拟机都是使用 Remembered Set 来避免全堆扫描的。G1中每个Region 都有一个与之对应的 Remembered Set，虚拟机发现程序在对Reference类型的数据进行写操作时，会产生一个 WriteBarrier 暂时中断写操作，检查 Reference 引用的对象是否处于不同的 Region 之中（在分代的例子中就是检查是否老年代中的对象引用了新生代中的对象），如果是，便通过 CardTable 把相关引用信息记录到被引用对象所属的 Region的Remembered Set 之中。当进行内存回收时，在 GC 根节点的枚举范围中加入 Remembered Set 即可保证不对全堆扫描也不会有遗漏。

G1 收集器之所以能建立可预测的停顿时间模型，是因为它可以有计划地避免在整个Java堆中进行全区域的垃圾收集。G1 跟踪各个 Region 里面的垃圾堆积的价值大小（回收所获得的空间大小以及回收所需时间的经验值），在后台维护一个优先列表，每次根据允许的收集时间，优先回收价值最大的 Region（这也就是 Garbage-First 名称的来由）。这种使用Region划分内存空间以及有优先级的区域回收方式，保证了G1 收集器在有限的时间内可以获取尽可能高的收集效率。

`7.2 运作步骤`

初始标记：仅仅只是标记一下 GC Roots 能直接关联到的对象，并且修改 TAMS（Next Top atMark Start）的值，让下一阶段用户程序并发运行时，能在正确可用的Region中创建新对象，这阶段需要停顿线程，但耗时很短。

并发标记：从 GC Root 开始对堆中对象进行可达性分析，找出存活的对象，这阶段耗时较长，但可与用户程序并发执行。而最终标记阶段则是为了修正在并发标记期间因用户程序继续运作而导致标记产生变动的那一部分标记记录，虚拟机将这段时间对象变化记录在线程Remembered Set Logs 里面。

最终标记：需要把 Remembered Set Logs 的数据合并到 Remembered Set 中，这阶段需要停顿线程，但是可并行执行。最后在筛选回收阶段首先对各个

筛选回收：首先对各个 Region 的回收价值和成本进行排序，根据用户所期望的 GC 停顿时间来制定回收计划，从 Sun 公司透露出来的信息来看，这个阶段其实也可以做到与用户程序一起并发执行，但是因为只回收一部分 Region，时间是用户可控制的，而且停顿用户线程将大幅提高收集效率。

G1收集器运行示意图:

而 G1 与 CMS 相比，虽然它们都立足于低停顿时间，但是随着 Oracle 对 G1 的持续改进，我相信 G1会是最终的胜利者。如果你现在采用的收集器没有出现问题，那就没有任何理由现在去选择 G1，如果你的应用追求低停顿，那 G1现在已经可以作为一个可尝试的选择，如果你的应用追求吞吐量，那 G1并不会为你带来什么特别的好处”。

目录CONTENT