詳盡探究synchronized原理后,原來性能這么好
前置思考
我們先來試著想一下實現一把鎖應該考慮哪些問題
- 如何獲取鎖資源?
- 獲取不到鎖資源的線程如何處理?
- 如何釋放鎖資源?
- 資源釋放后如何讓其他線程再次獲取鎖資源?
帶著上面幾個問題更深層次的思考如何解決上面幾個問題
- 鎖的標識
需要有個標識或者狀態來表示鎖是否已經被占用。 - 線程搶鎖的邏輯
多個線程如何搶鎖,如何才算搶到了鎖。 - 線程掛起的邏輯
線程如果沒有搶到鎖,我們都知道線程會阻塞掛起,那么如何阻塞掛起呢。 - 線程存儲機制
線程在Java中的表現其實就是一個Java對象綁定內核中的一條線程,也可以理解為這個對象是底層線程的載體,沒有搶到鎖的線程會阻塞掛起,那么線程的載體如何處置呢。一般我們想到的是將這些載體保存到集合或者隊列中。 - 線程釋放鎖的邏輯
線程在執行完業務邏輯后就要釋放鎖,如何才算釋放了鎖呢? - 線程喚醒的邏輯
鎖釋放后需要做什么呢,當然是喚醒被阻塞的線程。
不管是哪一種鎖我認為實現上必須都要考慮以上問題,而鎖的性能好壞就在于對以上問題解決的思路上是否為最優的處理
synchronized的使用
在介紹原理前我們先介紹synchronized的使用
- synchronized可以修飾實例方法。
- synchronized可以修飾靜態方法。
- synchronized可以修飾實例方法的代碼塊。
- synchronized可以修飾靜態方法的代碼塊。
public void get(){
synchronized(this){
}
}
public synchronized void get(){
}
可見其使用是很簡單的,只需要一個關鍵字,不需要程序員關心什么時候上鎖,什么時候釋放鎖。
對象的生成
創建對象
想要了解synchronized的底層原理就必須先了解Java中的對象是怎么生成的,這對于掌握synchronized原理至關重要。
java中如何創建一個對象?java代碼會被編譯成字節碼然后被jvm運行,jvm在遇到new關鍵字的時候就會啟動對象的創建流程,對象的大致流程如下:
圖片
默認情況下jvm加載類是懶加載的,所以創建對象的第一步是判斷類是否已經加載,如果沒有加載,需要先走類的加載流程。
接下來是分配內存,一個對象在類加載的時候就可以知道所需要的內存大小,此時就是在堆中劃分一塊區域出來作為對象的私密空間,具體如何分配和具體使用的垃圾回收器有關,jvm篇再細講,在偌大的堆中怎么為一個對象劃分區間呢?這里的分配主要是兩種方法:指針碰撞和空閑列表,但是不管哪種劃分方法都會存在并發問題,此時jvm的解決方案是TLAB和cas配合失敗重試,這些內容也將會在jvm篇進行了解,這里只需要知道給對象分配了內存即可。
初始化零值這一步是給對象中的屬性賦零值,比如int類型默認為0,這一步是避免屬性不賦值的情況下出現空指針異常。
每個對象都會有一個對象頭區域,這個區域包括Mark Word,元數據指針,數組長度三個部分,Mark Word用于保存對象的運行時數據,比如hashcode,分代年齡,鎖標識等,元數據指針是當前對象所屬類對象的地址,只有數組對象才會有數組長度。
最后初始化對象,這個時候一個完整的對象生成了。
一個完整對象的結構如下:
圖片
可以看到結構中有一個對其填充,對其填充是為了滿足對象的大小為8字節的整數倍,只有8字節的整數倍才是最高效的存取方式。所以一個對象的大小總是8字節的整數倍。
對象頭
對象頭是對象中用于保存實例數據外的運行時數據的區域。
我們知道java是面向對象的,在java的世界一切皆對象,所以整個jvm的設計都是圍繞對象,包括對象所屬類的加載,對象的創建,對象的保存,對象的銷毀,對象的回收,鎖的實現,以及jvm的內存結構等等都要圍繞對象設計,這就導致對象自身會有很多的運行時數據,比如垃圾回收依賴的分代年齡,代碼運行過程中用于標識對象唯一的hashcode,當用作鎖對象的時候鎖的相關信息存儲,記錄當前對象所屬的類對象指針等等。
所以jvm設計了對象頭,對象頭包括Mark Word,MetaDate,數組長度三部分。
Monitor
Java中的對象與生俱來會攜帶一個Monitor對象,這個Monitor對象可以說是對象的影子,它平時沒什么用,當對象作為鎖資源被線程搶占的時候,它就排上用場了,可以說Monitor對象就是為實現鎖而發明的,Monitor就類似一個監視器,所以說Java的老派鎖是監視器鎖。
這個Monitor對象是jvm級別實現的,是一個jvm級別的對象,所以我們在java端開發的時候是看不到摸不到的,但卻是真實存在的。
Monitor對象結構如下:
ObjectMonitor() {
_header = NULL;
_count = 0; // 記錄個數
_waiters = 0,
_recursions = 0;
_object = NULL;
_owner = NULL; // 占用資源的線程
_WaitSet = NULL; // 處于wait狀態的線程,會被加入到_WaitSet
_WaitSetLock = 0 ;
_Responsible = NULL ;
_succ = NULL ;
_cxq = NULL ;
FreeNext = NULL ;
_EntryList = NULL ; // 處于等待鎖block狀態的線程,會被加入到該列表
_SpinFreq = 0 ;
_SpinClock = 0 ;
OwnerIsThread = 0 ;
}
實現原理
synchronized鎖實現就是依賴這個Monitor對象實現的,我們看到上面Monitor對象的結構中的幾個屬性:_count,_owner,_WaitSet,_EntryList,大概也能猜的出來的這些參數都跟線程搶鎖有關系。
好了,我們直接來看這個鎖的實現原理。
synchronized鎖的寫法很簡單,簡單到只有一個關鍵字,我們也知道Java代碼是要編譯成字節碼文件然后被jvm虛擬機解析運行的,那就不難猜出這把鎖的邏輯實現是在編譯的字節碼中。
synchronized關鍵字被編譯后的大致表現如下:
圖片
整個代碼塊前后被monitorenter 和 monitorexit包裹,也就是說synchronized關鍵字的在編譯后就變為上面兩個關鍵字。到這里其實就和ReentrantLock的lock和unlock是一個道理了。
monitorenter 和 monitorexit這兩個是jvm級別字節碼指令,不難想到jvm在運行代碼的時候,遇到monitorenter關鍵字,一定會啟動搶鎖的邏輯,包括搶鎖,入隊,阻塞;而遇到monitorexit的時候一定會走釋放鎖邏輯,包括釋放鎖,喚醒阻塞線程。
而所謂的入隊應該就可以聯想到Monitor對象中的那幾個屬性了。阻塞的實現則是依賴于操作系統底層的互斥原語mutex。
上面做了一些相關知識的介紹,可能還比較碎片化,接下來我們就通過加鎖流程將所有信息都串聯起來。
Java1.5的鎖
java最開始的鎖的實現依賴鎖對象,對象的Monitor對象,操作系統互斥原語mutex。
- 線程運行到 monitorenter 關鍵字后,jvm判斷此線程進入了互斥區域,jvm底層會調用操作系統底層的互斥原語Mutex實現線程線程互斥。
- 如果在此之前沒有其他線程占據互斥區域,則當前線程會占據互斥區域,意味著當前線程搶到了鎖資源,會將自身的線程id存儲到鎖對象對應的Monitor對象的_owner屬性,count屬性加1。
- 如果此時互斥區域已經有一個線程占有,當前線程會被阻塞,當前線程id則會被存儲到鎖對象對應的Monitor對象的_EntryList屬性,并且將線程阻塞掛起。
- 占有資源的線程繼續運行,當遇到monitorexit關鍵字的時候就要釋放鎖,此時jvm會喚醒隨機喚醒_EntryList里面的一個線程,被喚醒的線程會再次搶奪資源,沒有搶到資源的線程將會再次被阻塞,所以說synchronized是一個非公平的鎖。
那么鎖對象和Monitor對象是怎么關聯的呢?
是通過將Monitor對象的引用存儲到對象頭的Mark Word中實現的關聯。
Java1.6之前的synchronized大概就是這樣一個實現原理,之所以業界普遍認為其性能很低是因為其有一個很大的弊端,就是每個線程在搶鎖的時候都要調用操作系統的底層api,這就導致用戶態到內核態的切換,我們都知道Java程序性能最忌諱的就是用戶態與內核態的來回切換。然而,我們程序并不每時每刻都會有很多線程競爭鎖資源,相反,大多數時間里,只有一個線程在執行加鎖的邏輯,那么這種情況下每次都發生用戶態和內核態切換無疑是沒有必要的性能消耗。所以業界對其性能持望而卻步的態度。
1.5后的鎖
JVM內置鎖在1.5之后版本做了如下重大的優化,在做了優化后,其性能顯著提高,基本與ReentrantLock保持同等性能。
- 鎖粗化
- 鎖消除
- 鎖升級:輕量級鎖 偏向鎖 適應性自旋
接下來由淺入深講解優化內容
1. 鎖消除
鎖的消除,顧名思義就是將鎖去除,因為有些場景下鎖是可以去除的
public void sync() {
Sync sync=new Sync();
synchronized(sync){
}
}
如上這種情況,我們知道進出一個方法就是當前線程棧的入棧出棧,所以方法內部只要不涉及共享資源操作就是線程安全的,如上這段代碼,sync對象聲明在方法內部,其引用是局部變量,是線程獨享資源不是共享資源,是線程獨有資源,隨著出棧發生,對象也就銷毀了,因此此處是可以不用加鎖的,鎖消除優化就是對這種情況進行去除鎖的處理。
jvm如何進行優化的呢?jvm在JIT編譯時(可以簡單理解為當某段代碼即將第一次被執行時進行編譯,又稱即時編譯),通過對運行上下文的掃描,通過逃逸分析判斷方法中的是否存在共享資源,如果無共享資源則去除不存在共享資源競爭的鎖,從而節省請求鎖時間。
典型的案例是StringBuffer的使用,后續會講解。
通過上面我們知道鎖消除依賴逃逸分析,逃逸分析是可以通過jvm參數配置的,如下:
-XX:+DoEscapeAnalysis 開啟逃逸分析
-XX:+EliminateLocks 開啟鎖消除
逃逸分析可以簡單理解為分析資源是否能逃逸到其他方法或者其他線程中。
2. 鎖粗化
顧名思義,把小范圍的多個鎖變成大范圍少個鎖。
public Sync sync=new Sync();
public void sync() {
synchronized(sync){
}
synchronized(sync){
}
synchronized(sync){
}
}
上面的代碼可以看出,一個邏輯被多次加同一把鎖,每一次上鎖都是會耗時的,所以完全可以把多個鎖合并為一個鎖,這樣只需要上一次鎖就可以了,大大節省了時間。
同樣jvm在即時編譯的時候會掃描判斷是否存在可以粗化的鎖行為。
3. 鎖膨脹
鎖膨脹又叫鎖升級。synchronized之所以能在性能上與ReentrantLock持平就得益于鎖膨脹的優化。
鎖升級是鎖優化后的鎖機制,這個機制中包含這樣幾個概念:偏向鎖,輕量級鎖,適應性自旋,重量級鎖。在整個鎖膨脹的過程中對對象頭的依賴更加明顯。
鎖升級是依靠對象頭的Mark Word來保存標志信息的,接下來以32位操作系統來看下鎖升級過程中的對象頭中運行時數據的變化。
圖片
- 無鎖狀態 當沒有任何線程進入的時候,此時處于無鎖狀態,Mark Word中會有25bit的空間大小留給hashcode,4bit的空間大小留給對象的分代年齡信息,1bit的空間大小是標識是否偏向(0否,1是),2bit的空間大小是鎖標識位。
此時鎖標志位為01,是否偏向為0,代表無鎖狀態。但是此時并不一定有hashcode,因為hashcode是代碼運行過程中調用生成方法才生成的,如果運行過程不調用就不會生成。
請注意,hashcode的生成是會影響鎖的升級過程的。
- 偏向鎖狀態
當第一個線程T1進入代碼塊后的步驟(前提條件是全程無hashcode生成)
- 判斷是否處于偏向中(通過Mark Word中的是否偏向判斷)
- 此時未處于偏向中,當前線程會將自己的線程id保存到Mark Word中,設置是否偏向為1,此時鎖標志位依然是01
此時Mark Word為:23bit的線程id,4bit的分代年齡,是否偏向為1,鎖標識位依然為01。
此時是偏向鎖狀態,它其實是一種特殊的無鎖狀態。
上面的過程是建立在全程無hashcode生成的基礎上,我們知道了hashcode會占用25bit,線程id會占用23bit,如果過程有hashcode生成怎么辦,這里涉及到兩個問題。
第一個問題,T1進入前就已經生成了hashcode怎么處理?
jvm的做法是如果偏向前已經生成hashcode,那么就放棄偏向,直接進入輕量級鎖。
第二個問題,T1進入后鎖狀態變為了偏向鎖,此時生成hashcode怎么處理?
jvm的做法是撤銷偏向,直接進入重量級鎖。
所以我們在使用鎖的時候要特別注意hashcode生成給鎖升級帶來的影響。
- 輕量級鎖狀態
當第二個線程T2進入代碼塊后
- 判斷是否處于偏向中(通過Mark Word中的是否偏向判斷)
- 如果處于偏向中,T2會以cas的方式試圖將Mark Word中的線程id替換為自己的線程id
- 如果T1已經執行完代碼塊,T2一定是可以替換成功的,此時鎖依然是偏向鎖狀態
- 如果T1沒有執行完代碼塊,T2一定是替換不成功的,此時將進入偏向鎖撤銷升級為輕量級鎖的過程
- 首先T1會進入到安全點,T1和T2會在自己的棧空間開辟一塊區域用于保存鎖記錄,同時復制一份Mark Word到這個鎖記錄中,同時cas的方式將自己棧空間這個鎖記錄的指針設置到Mark Word中去,因為T1持有偏向鎖,所以T1會優先設置成功,此時Mark Word中有30bit的鎖記錄指針和2bit的鎖標志位,此時的鎖標志位為00代表輕量級鎖,鎖記錄指針指向當前持有輕量級鎖的線程中棧空間的地址。T2沒有替換成功,將會進入不斷輪詢失敗重試過程。
輕量級鎖是在資源競爭壓力不是很大的情況下,避免每個線程都去獲取鎖而造成用戶態到內核態的切換,這個切換是比較耗時的,這樣就能提高性能,但是如果競爭壓力大的情況下輕量級鎖就不行了,因為壓力大意味著有很多線程在輪序失敗重試獲取輕量級鎖,短時間內會造成cpu壓力飆升,甚至拖垮cpu,這個時候就必須升級為重量級鎖。
那么如何才算競爭壓力大,什么時候會升級為重量級鎖呢?
jvm默認輪詢次數限制值為十次,超過十次獲取不到資源就代表競爭壓力比較大了,用戶也可以使用如下參數配置來自行更改這個次數
-XX:PreBlockSpin
但是有個問題,如果通過這個默認值或者這個jvm參數配置限制數量,那意味著jvm全系統的鎖都要遵循,這個數字可能不適用于所有的鎖,因此jvm引入了自適應的自旋。自適應意味著自旋的時間不再是固定的了,而是由前一次在同一個鎖上的自旋時間及鎖的擁有者的狀態來決定的。如果在同一個鎖對象上,自旋等待剛剛成功獲得過鎖,并且持有鎖的線程正在運行中,那么虛擬機就會認為這次自旋也很有可能再次成功,進而允許自旋等待持續相對更長的時間,比如持續100次忙循環。另一方面,如果對于某個鎖,自旋很少成功獲得過鎖,那在以后要獲取這個鎖時將有可能直接省略掉自旋過程,以避免浪費處理器資源。有了自適應自旋,隨著程序運行時間的增長及性能監控信息的不斷完善,虛擬機對程序鎖的狀況預測就會越來越精準,虛擬機就會變得越來越“聰明”了。
- 重量級鎖
重量級鎖就是Monitor鎖,也叫監視器鎖,其實現是依靠操作底層的互斥原語Mutes Lock,因為每一次獲取Monitor鎖都需要用戶態到內核態的切換,所以比較耗時,也是重量級鎖的由來。 當自旋的條件破壞后,比如自旋次數達到限制或者競爭的壓力越來越大,將不再自旋,輕量級鎖升級為重量級鎖,當前對象頭中的Mark Word被復制一份到Monitor對象中,Mark Word中原來的輕量級鎖的鎖記錄指針被換成Monitor對象的指針,然后所有的線程會搶奪Monitor鎖的擁有權,以cas方式將自己的線程id填充到Monitor對象的_owner字段,同時_count字段加1,當然此時能夠cas成功的只會是原來持有輕量級鎖的線程,而那些沒有獲取到Monitor鎖的線程將會被阻塞并放入Monitor對象的_EntryList字段等待喚醒。
此時鎖的標志位為10,表示重量級鎖。
當線程退出Monitor鎖,便會將Monitor鎖中的_count減1,清空_owner,jvm會隨機喚醒_EntryList集合中一個線程重新獲取Monitor鎖,這個隨機便突出了synchronized的不公平性。
總結
在使用synchronized的時候一定要注意hashcode生成對鎖的影響,因為對象頭的mark word是保存對象運行期數據的,這塊區域在32位機器上是32字節,在64位機器上是64字節,所以空間是有限的,是無法同時保存hashcode和輕量級鎖記錄指針或者Monitor對象指針的,因為會做一些取舍。
synchronized鎖的隨機性決定了其非公平的特性。
synchronized鎖為什么是重量級鎖,為什么性能差,就是因為在優化前,每個線程的進入都會造成用戶態到內核態的切換,而我們要的理想狀態是只有一個線程或者只有少量線程競爭的時候不進行用戶態到內核態的切換。從而提高性能。優化后做到了。