Java垃圾回收調(diào)優(yōu)實(shí)戰(zhàn)
Java 垃圾回收調(diào)優(yōu)不同于任何其它性能優(yōu)化活動(dòng)。
首先你要確保自己足夠了解整個(gè)應(yīng)用的情況以及調(diào)優(yōu)預(yù)期的結(jié)果,而不是單單滿足于應(yīng)用的某一部分調(diào)優(yōu)。一般情況下,遵循以下過(guò)程比較容易:
-
明確自己的性能目標(biāo)。
-
測(cè)試。
-
測(cè)量調(diào)優(yōu)結(jié)果。
-
與目標(biāo)進(jìn)行比較。
-
改變方法并再次測(cè)試。
性能調(diào)優(yōu)目標(biāo)要是可確定且可測(cè)量的,這非常重要。這些目標(biāo)包括延遲、吞吐量和容量,想要了解更多,我推薦看看垃圾回收手冊(cè)(Garbage Collection Handbook)中相應(yīng)的章節(jié)。讓我們看看在實(shí)踐中如何設(shè)定并達(dá)到這樣的調(diào)優(yōu)目標(biāo)。為了這個(gè)目的,讓我們來(lái)看一個(gè)示例代碼:
- //imports skipped for brevity
- public class Producer implements Runnable {
- private static ScheduledExecutorService executorService = Executors.newScheduledThreadPool(2);
- private Deque<byte[]> deque;
- private int objectSize;
- private int queueSize;
- public Producer(int objectSize, int ttl) {
- this.deque = new ArrayDeque<byte[]>();
- this.objectSize = objectSize;
- this.queueSize = ttl * 1000;
- }
- @Override
- public void run() {
- for (int i = 0; i < 100; i++) {
- deque.add(new byte[objectSize]);
- if (deque.size() > queueSize) {
- deque.poll();
- }
- }
- }
- public static void main(String[] args) throws InterruptedException {
- executorService.scheduleAtFixedRate(new Producer(200 * 1024 * 1024 / 1000, 5), 0, 100, TimeUnit.MILLISECONDS);
- executorService.scheduleAtFixedRate(new Producer(50 * 1024 * 1024 / 1000, 120), 0, 100, TimeUnit.MILLISECONDS);
- TimeUnit.MINUTES.sleep(10);
- executorService.shutdownNow();
- }
- }
代碼中提交了兩個(gè)作業(yè)(job),且每 100ms 運(yùn)行一次。每個(gè)作業(yè)模擬特定對(duì)象的生命周期:先創(chuàng)建對(duì)象,讓它們“存活”一段時(shí)間,然后忘記它們,讓 GC 回收內(nèi)存。 運(yùn)行這個(gè)示例時(shí),開(kāi)啟 GC 日志并使用以下參數(shù):
-XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintGCTimeStamps
我們立即在日志文件中看到 GC 的影響和下面這些相似:
- 2015-06-04T13:34:16.119-0200: 1.723: [GC (Allocation Failure) [PSYoungGen: 114016K->73191K(234496K)] 421540K->421269K(745984K), 0.0858176 secs] [Times: user=0.04 sys=0.06, real=0.09 secs]
- 2015-06-04T13:34:16.738-0200: 2.342: [GC (Allocation Failure) [PSYoungGen: 234462K->93677K(254976K)] 582540K->593275K(766464K), 0.2357086 secs] [Times: user=0.11 sys=0.14, real=0.24 secs]
- 2015-06-04T13:34:16.974-0200: 2.578: [Full GC (Ergonomics) [PSYoungGen: 93677K->70109K(254976K)] [ParOldGen: 499597K->511230K(761856K)] 593275K->581339K(1016832K), [Metaspace: 2936K->2936K(1056768K)], 0.0713174 secs] [Times: user=0.21 sys=0.02, real=0.07 secs]
基于日志中的信息,我們可以開(kāi)始改善性能。并請(qǐng)牢記三個(gè)不同的目標(biāo):
-
確保 GC pause(垃圾回收暫停)的最壞情況不要超過(guò)預(yù)期的臨界值。
-
確保應(yīng)用程序線程停滯時(shí)間不超過(guò)預(yù)先確定的閥值。
-
降低基礎(chǔ)架構(gòu)成本,同時(shí)確保我們?nèi)钥梢詫?shí)現(xiàn)合理的延遲和吞吐量目標(biāo)。
為此,以三個(gè)不同的配置各運(yùn)行了10分鐘,在下表中總結(jié)了三個(gè)差距較大的結(jié)果:
堆 |
GC算法 |
有效工作 |
長(zhǎng)暫停 |
---|---|---|---|
-Xmx12g |
-XX:+UseConcMarkSweepGC |
89.8% |
560 ms |
-Xmx12g |
-XX:+UseParallelGC |
91.5% |
1,104 ms |
-Xmx8g |
-XX:+UseConcMarkSweepGC |
66.3% |
1,610 ms |
實(shí)驗(yàn)中,設(shè)置不同的 GC 算法和不同的堆大小,運(yùn)行相同的代碼,然后測(cè)量垃圾回收暫停的持續(xù)時(shí)間和吞吐量。實(shí)驗(yàn)細(xì)節(jié)和結(jié)果的解釋都在我們的垃圾回收手冊(cè)中。看看手冊(cè)中的一些例子,修改一些簡(jiǎn)單的配置造成延遲、吞吐量等各方面的性能完全不同。
注意:為了保持示例盡可能簡(jiǎn)單,只有數(shù)量有限的輸入?yún)?shù)被改變,例如沒(méi)有對(duì)不同數(shù)量的核心(CPU core)或不同堆布局進(jìn)行測(cè)試。