深入分析JVM執行引擎
一、閑聊
相信很多朋友在出國旅游,或者與外國友人溝通的過程中,都會遇到語言不通的煩惱。這時候我們就需要掌握對應的外語或者擁有一部翻譯機。而筆者只會中文,所以需要借助一部翻譯器才能與不懂中文的外國友人交流。咱們的執行引擎就類似于這部“翻譯機”。
二、概述
執行引擎的作用就是將字節碼指令解釋或者編譯為對應平臺上的本地機器指令。簡單來說,執行引擎充當了將高級語言翻譯為機器語言的翻譯者。對于Hotspot虛擬機,執行引擎中包含兩部分:解釋器和JIT編譯器(即時編譯器)。下圖是執行引擎的原理:
三、解釋器
解釋器所承擔的角色就是一個運行時翻譯者?,將字節碼文件中的內容翻譯?為對應平臺的本地機器碼指令。當一條字節碼指令被解釋執行后,接著再根據pc寄存器中記錄的下一條需要被執行的字節碼指令執行解釋操作。JVM解釋器一共有兩套,一套是遠古的字節碼解釋器?,另一套是現在普遍使用的模板解釋器。
1、字節碼解釋器
字節碼解釋器在執行過程中通過純軟件代碼模擬字節碼執行,效率非常低。
2、模板解釋器
模板解釋器將每一條字節碼和一個模板函數關聯,模板函數中直接產生這條字節碼指令執行時的機器碼,從而提高了解釋器的性能。在常用的HotSpot VM中,解釋器主要由Interpreter模板和code模塊構成。Interpreter模板:實現了解釋器的核心功能。code模塊:用于管理HotSpot VM在運行時生成的本地機器碼指令。
四、即時編譯器(JIT編譯器)
即時編譯器的目的是避免函數被解釋執行,而是將整個函數體編譯成機器碼指令,每次函數執行時,只執行編譯后的機器碼即可,這種方式可以大大的提高效率。
1、熱點代碼及探測方式
當然,是否需要JIT編譯器將字節碼直接編譯成對應平臺的機器碼,需要根據代碼被調用的執行頻率?而定。需要被JIT編譯器編譯成機器碼的字節碼,也稱為熱點代碼?,JIT編譯器會對熱點代碼做出深度優化?,將其從字節碼編譯成機器碼,并緩存到方法區?,提高代碼的執行效率。JIT編譯的方式發生在方法執行過程中,因此也被稱之為_棧上替換_,或簡稱OSR(On Stack Replacement)編譯。通過熱點探測的方法,判斷一個方法被調用多少次,或循環體執行多少次才可以達到閾值,進行編譯。而Hotspot VM熱點探測的方式是基于計數器實現的。這種基于技術的熱點探測方式又分為兩種:1.方法調用計數器 2.回邊計數器
關于棧上替換這里筆者不展開贅述,有興趣的小伙伴可以自行了解下
1.1方法調用計數器
方法調用計數器用于統計方法調用次數,它的默認閾值是client模式下是1500次,在server模式下是10000次。超過這個閾值,就會觸發JIT編譯。當然,這個閾值也可以通過修改虛擬機參數-XX:CompileThreshold來手動指定。當一個方法被調用的時候,會優先檢查該方法是否被JIT編譯過,如果存在,則優先使用編譯過的本地代碼來執行,如果不存在,則將此方法的調用計數器加一,然后再判斷計數器的值是否超過配置的閾值。如果已經超過了,就會向JIT編譯器提交一個該方法的編譯請求。下面是方法調用計數器執行的流程圖:
關于方法調用計數器,如果不做任何設置,方法調用計數器統計的并不是方法被調用的絕對次數,而是一個相對執行的頻率。當超過一定的時間限度,如果方法的調用次數仍然達不到閾值,那這個方法的調用計數器就會被減少一半,這個過程稱為方法調用計數器的熱度衰減?,而這段時間被稱作為該方法的半衰周期?。進行熱度衰減的過程是虛擬機進行垃圾回收的時候順便進行的,舉手之勞而已。可以使用虛擬機參數-XX:-UseCounterDecay?來關閉熱度衰減。這樣的話,只要運行時間足夠長,絕大部分方法都會被編譯成本地代碼。最后,還可以使用-XX:CounterHalfLifeTime參數設置半衰周期的時間,單位為秒。
1.2回邊計數器
它的作用是統計一個方法中循環體代碼執行次數,在字節碼中遇到控制流向后,跳轉的指令稱為“回邊”。顯然,建立回邊計數器統計的目的是為了觸發OSR編譯。下面是回邊計數器執行的流程圖:
關于OSR編譯上文中有提到
2、即時編譯器分類
在Hotspot VM中,內嵌有兩個JIT編譯器,分別為client compiler和server compiler,但是大多數情況下我們簡稱C1編譯器和C2編譯器。可以通過命令顯示的指定JVM在運行時到底使用哪種JIT編譯器。
2.1 c1編譯器
指定Java虛擬機運行在client模式下,使用C1編譯器。C1編譯器會對字節碼進行簡單和可靠的優化,耗時短。以達到更快的編譯速度,但是編譯后的代碼執行速度相對慢。C1編譯器主要有方法內聯,去虛擬化,冗余消除。
方法內聯:將引用的函數代碼編譯到引用點處,這樣可以減少棧幀的生成,減少參數傳遞以及跳轉過程。
去虛擬化:對唯一實現的類進行內聯。
冗余消除:在運行期間把一些不會執行的代碼疊掉。
2.2 c2編譯器
指定Java虛擬機運行在server模式下,使用C2編譯器。C2編譯器對代碼優化時間長,編譯時間也長。但是編譯后的代碼執行速度比較快。C2的優化主要在全局層面,逃逸分析是優化的基礎。基于逃逸分析,C2上有如下幾種優化:
標量替換:用標量值代替聚合對象的屬性值。
棧上分配:對于未逃逸的對象分配在棧上而不是堆上。
同步消除:清除同步操作,通常指synchronized。
2.3 Graal編譯器
JDK10起,在C1編譯器和C2編譯器之后,HotSpot VM新增了一個Graal即時編譯器。編譯效果短短幾年的時間就追平了C2編譯器。目前,帶著“實驗狀態”標簽,需要使用開關參數-XX:+UnlockExperimentalVMOptions,-XX:+UseJVMCICompiler去激活這個編譯器,才能使用。
五、解釋器和JIT并存
為什么需要解釋器和JIT并存,原因有幾點:
當程序啟動的時候,解釋器可以馬上發揮作用,省去編譯的時間。
編譯器想要執行,需要把字節碼編譯成本地機器碼,并且緩存編譯后的機器碼,編譯需要一定的時間。
編譯后的本地機器碼,執行效率高。所以,在兩種并存的模式下,解釋器首先發揮作用,而不必等到即時編譯器全部編譯完再執行,這樣可以省去不必要的編譯時間。
隨著程序繼續不斷運行,編譯器發揮作用,根據熱點探測功能,把越來越多的字節碼編譯成本地機器碼,獲得更高的執行效率。
六、執行引擎執行程序的方式
在默認的情況下,HotSpot VM采用的是解釋器和JIT編譯器并存的架構,當然讀者可以根據具體的應用場景,通過虛擬機參數,為虛擬機指定在運行時到底是完全采用解釋器執行,還是完全采用即時編譯器執行。
-Xint:完全采用解釋器模式執行程序
-XComp:完全采用即時編譯器模式執行程序。如果即時編譯器出現問題,解釋器會介入執行;
-Xmixed:采用解釋器+即時編譯器的混合模式共同執行程序,HotStop VM默認就是這個模式。
七、參考源碼
編程文檔:https://gitee.com/cicadasmile/butte-java-note
應用倉庫:https://gitee.com/cicadasmile/butte-flyer-parent