JVM 性能調優之通過 JProfile 和 JFR 分析系統瓶頸提升系統性能
生成 jfr
JDK飛行記錄器(JFR)是一種結構化日志記錄工具, 它記錄廣泛的系統級(system-level)事件。類似于飛機上的黑盒子,它會持續記錄飛行數據,用于調查飛行事故。JFR會持續記錄JVM中的 一系列事件,用于診斷問題。這種方式的優勢是,它會按時間順序,捕獲導致事故的,詳細系統信息。JFR被設計的,對于性能影響很小,所以 可以安全地在生產環境長時間運行。
優勢:
- 對于運行系統的影響比較小,額外占用資源小于 1%
- 生成的文件比較小,通常生成 10 多分鐘的文件往往小于 1G
查詢 java 進程
通過 jps 命令查詢。
通過 ps -ef | grep java 查詢。
生成 jfr 文件
生成飛行記錄,使用 JFR.start 該實用程序的診斷命令 jcmd。
jcmd 84743 JFR.start duratinotallow=5m settings=profile filename=~/jfr/xxkk.jfr
JProfile 介紹
JProfiler是一個用于分析運行JVM內部情況的專業工具。在開發中你可以使用它,用于質量保證,也可以解決你的生產系統遇到的問題。
JProfiler處理四個主要問題:
- 方法調用這通常被稱為"CPU分析"。方法調用可以通過不同的方式進行測量和可視化, 分析方法調用可以幫助了解你的應用程序正在做什么,并找到提高其性能的方法。
- 分配分析堆上對象的分配、引用鏈和垃圾回收屬于"內存分析"的范疇。這個功能可以讓你解決內存泄漏,總之使用更少的內存,分配更少的臨時對象。
- 線程和鎖線程可以持有鎖,例如通過在一個對象上做同步。當多個線程協作時,可能會出現死鎖,JProfiler可以為你可視化這種情況。此外,鎖可能被爭用,這意味著線程在獲得鎖之前必須等待。通過JProfiler可以深入了解線程及其各種鎖情形。
- 高層子系統許多性能問題發生在更高的語義層面。例如,對于JDBC調用,你可能想找出哪條SQL語句是最慢的。對于這樣的子系統,JProfiler提供了"探針",將特定有效載荷附加到調用樹。
JProfiler的UI是一個桌面應用程序。你可以以交互的方式實時分析JVM,也可以在不使用UI的情況下,自動化分析。保存在快照中的分析數據,可以通過JProfiler UI打開。此外,命令行工具和構建工具集成可以幫助你自動分析會話。
注意:JProfile 是商業軟件,希望大家在使用的過程中購買正版授權
內存分析
記錄的對象
內存分析中,可以通過記錄的對象找到最耗費內存的對象。只有總對象大小超過固定閾值(通常是堆的1%)的類才會被記錄。默認情況下,JFR中禁用了這個功能,因為它會引入大量的開銷。
下面兩個字段的解釋:
- **實例計數示例, **可以看到某個用例的堆上還剩下哪些對象(實際上會小于總大小除以每個對象的平均大小)。
- 預估總大小,這個是一個預估值,預估在開始 jfr 記錄,到 jfr 記錄結束這個類的實例總大小
https://docs.oracle.com/en/java/javase/17/docs/specs/man/jfr.html。
分配熱點
分配熱點視圖與分配調用樹一起,允許你直接關注負責創建所選類的方法。就像記錄的對象視圖,分配熱點視圖也支持標記當前狀態和觀察一段時間內的差值。視圖中會添加一個差值列,它顯示了熱點自當_標記當前值_操作被調用后的變化。因為默認情況下,分配視圖不會定期更新,所以你必須單擊_計算_工具欄按鈕以獲得一個新數據集然后與基線值比較。
計算熱點:
熱點分析:
熱點的分配類:
找到主要是因為 byte[] 數組分配,成為一個分配熱點方法。
測試代碼
/**
* VM ARG : -Xms64m -Xmx64m
*/
public static void main(String[] args) throws InterruptedException {
List<byte[]> list = new ArrayList<>(1000);
//2kb * 10 * 120 = 2400kb
//數量 = 10 * 120 / 10 = 120
for (int i = 0; i < 10000; i++) {
Thread.sleep(100);
byte[] arr = new byte[1024 * 2];
list.add(arr);
}
}
CPU 分析
調用樹
跟蹤所有的方法調用及其調用棧會消耗相當大的內存,短時間內就會耗盡所有內存。另外,在一個繁忙的JVM中,很難直觀獲得方法調用的數量。通常情況下,這個數字是如此之大,以至于定位和跟隨跟蹤是不可能的。
另一個方面,只有將收集到的數據進行匯總,許多性能問題才會變得清晰。這樣,你就可以知道在某個時間段內,方法調用相對于整個活動的重要性。如果是單一的跟蹤,你對你所看的數據的相對重要性沒有概念。
這就是為什么JProfiler建立了一個所有觀察到的調用堆棧的累積樹,并注解有觀察到的時間和調用次數。時間順序信息被消除,只保留總數。樹中的每個節點代表一個至少被觀察過一次的調用堆棧。節點的子節點代表在該調用堆棧中看到的所有傳出調用。
調用樹是"CPU視圖"部分的第一個視圖,當你開始進行CPU分析時,它是一個很好的起點, 因為遵循方法調用從起點到最細化的終點的自上而下視圖,最容易理解。JProfiler按照子節點的總時間進行排序,所以你可以深度優先打開樹,分析對性能影響最大的部分。
熱點
如果你的應用程序運行得太慢,你要找到那些占用大部分時間的方法。通過調用樹,有時可以直接找到這些方法, 但通常這樣做是行不通的,因為調用樹可能很大而且有大量葉節點
在這種情況下,你需要反轉調用樹:一個所有方法的列表,按其總的自身時間排序,從所有不同的調用堆棧中累計出來, 并通過回溯跟蹤顯示這些方法是如何被調用的。在熱點樹中,葉節點是入口點, 就像應用程序的main 方法或線程的run 方法。從熱點樹中最深的節點開始,調用向上傳遞到頂層節點。
回溯跟蹤中的調用次數和執行時間并不是指該方法節點,而是指頂層熱點節點在這條路徑上被調用的次數。理解這一點很重要:粗略一看,你會認為看到的節點上的信息是該節點的調用次數。然而,在熱點樹中,該信息顯示的是該節點對頂層節點的貢獻。所以,你必須這樣理解這些數字: 沿著這個倒置的調用堆棧,頂層熱點被調用了n 次,總持續時間為t 秒。
通過這里可以看到這個 CASE 是因為正則導致的 CPU 熱點。
測試代碼
static String pattern = " ^([\\u4e00-\\u9fa5]+)((·[\\u4e00-\\u9fa5]+)+|([\\u4e00-\\u9fa5]+))$";
static String defaultName = "張三·無論其是看都看吶阿斯頓啊·薩肯薩肯打開你發都看啊看你發個卡看那可能發看那個可能看吶";
public static void main(String[] args) throws InterruptedException {
int time = 1;
String result;
while (true) {
if (time > 0) {
Thread.sleep(time);
}
result = defaultName.matches(pattern) ? "姓名合法" : "姓名不合法";
}
}
參考文檔
- jcmd 指令詳解:https://docs.oracle.com/javacomponents/jmc-5-5/jfr-command-reference/diagnostic-command-reference.htm。
- 生成 jfr 文件:https://docs.oracle.com/javacomponents/jmc-5-5/jfr-runtime-guide/run.htm。
- jprofile 中文手冊:https://www.ej-technologies.com/resources/jprofiler/v/13.0/help_zh_CN/doc/main/memory.html。