面試分布式事務必問知識點!
相信大部分小伙伴在面試過程中,只會針對面試官提出的表面問題來進行回答。其實不然,面試官問的每一個問題都是經過深思熟慮的。
面試的時間相對來說也是短暫的,面試官不可能在很短的時間內就對你非常了解,他想通過幾個問題來考察你所掌握的知識的深度和廣度,如果你只是回答面試官表面問你的問題,像擠牙膏一樣,問一點,答一點,結果不用說,肯定是涼涼了。
面試問題
說說什么是事務?并發事務會帶來哪些問題呢?
分析問題
表面上看,面試官是問了兩個問題。一個是:什么是事務,也就是讓你說說事務的基本概念;另一個是:并發事務會帶來哪些問題。
實則不然,聽到面試官這樣問,你不要隨意回答。要用極短的時間思考一下,面試官究竟想要得到什么答案。
對于第一個問題:說說什么是事務?就只是讓你簡單的說說事務的基本概念嗎?基本概念相信是個學過數據庫的小學生都會,面試官為什么會問你這個問題呢?
此時,你需要揣測面試官的心理。此時的面試官其實想問你的不就是事務的基本概念,而且他也想讓你說出事務的特性,也就是四大屬性。這才是這個問題的核心所在!
對于第二個問題:并發事務會帶來哪些問題呢?就只是想問一下會帶來哪些問題嗎?知道問題,不知道如何解決問題,這樣的面試者面試官能要嗎?究其本質,面試官是想問你并發事務會帶來哪些問題,有哪些解決方案能夠解決這些問題!這才是面試官想要的答案!
綜上,面試官本質上問的問題是:什么是事務?事務的四大特性是什么?并發事務會帶來哪些問題?有哪些解決方案?你只有深刻理解了面試官提問的本質,才能更好的回答面試官所提出的問題。不然,你應付面試官,面試官也會應付你。
什么是事務?
事務的概念理解起來還比較簡單的:事務是指作為單個邏輯工作單元執行的一系列操作,要么完全地執行,要么完全地不執行。
事務處理可以確保除非事務性單元內的所有操作都成功完成,否則不會永久更新面向數據的資源。通過將一組相關操作組合為一個要么全部成功要么全部失敗的單元,可以簡化錯誤恢復并使應用程序更加可靠。
一個邏輯工作單元要成為事務,必須滿足所謂的ACID(原子性、一致性、隔離性和持久性)屬性。事務是數據庫運行中的邏輯工作單位,由DBMS中的事務管理子系統負責事務的處理。
事務的四大特性
原子性(Atomicity)
事務必須是原子工作單元;對于其數據修改,要么全都執行,要么全都不執行。比如轉賬,要么轉賬成功,賬戶余額增加(減少);要么轉賬失敗,賬戶余額不變。
一致性(Consistency)
事務在完成時,必須使所有的數據都保持一致狀態。在相關數據庫中,所有規則都必須應用于事務的修改,以保持所有數據的完整性。
事務結束時,所有的內部數據結構(如 B 樹索引或雙向鏈表)都必須是正確的。某些維護一致性的責任由應用程序開發人員承擔,他們必須確保應用程序已強制所有已知的完整性約束。
例如,當開發用于轉帳的應用程序時,應避免在轉帳過程中任意移動小數點。
隔離性(Isolation)
由并發事務所作的修改必須與任何其它并發事務所作的修改隔離。事務查看數據時數據所處的狀態,要么是另一并發事務修改它之前的狀態,要么是另一事務修改它之后的狀態,事務不會查看中間狀態的數據。這稱為隔離性。
因為它能夠重新裝載起始數據,并且重播一系列事務,以使數據結束時的狀態與原始事務執行的狀態相同。當事務可序列化時將獲得最高的隔離級別。
在此級別上,從一組可并行執行的事務獲得的結果與通過連續運行每個事務所獲得的結果相同。由于高度隔離會限制可并行執行的事務數,所以一些應用程序降低隔離級別以換取更大的吞吐量。
持久性(Durability)
事務完成之后,它對于系統的影響是永久性的。該修改即使出現致命的系統故障也將一直保持。
例如我們在使用JDBC操作數據庫時,在提交事務方法后,提示用戶事務操作完成,當我們程序執行完成直到看到提示后,就可以認定事務以及正確提交,即使這時候數據庫出現了問題,也必須要將我們的事務完全執行完成,否則就會造成我們看到提示事務處理完畢,但是數據庫因為故障而沒有執行事務的重大錯誤。
并發事務帶來的問題
臟寫問題
當兩個或多個事務選擇同一行,然后基于最初選定的值更新該行時,會發生丟失更新問題。每個事務都不知道其它事務的存在。最后的更新將重寫由其它事務所做的更新,這將導致數據丟失。
例如,T1和T2同時修改一條數據,T2的修改覆蓋了T1的修改;如果在T1之后T2才能進行更改,則可以避免該問題。
我們來看一個經典的轉賬問題,開始小明和小剛都有1000元錢,在事務T1中,小明為小剛轉賬100元,在事務T2中,小剛為小明轉賬200元。則正常情況下,結果為:小明有1100元,小剛為900元。如果發生了臟寫的問題,則結果可能為:小明1200元,小剛800元。如下圖所示。
臟讀問題
一個事務正在對一條記錄做修改,在這個事務完成并提交前,這條記錄的數據就處于不一致狀態;這時,另一個事務也來讀取同一條記錄,如果不加控制,第二個事務讀取了這些“臟”數據,并據此做進一步的處理,就會產生未提交的數據依賴關系。這種現象被形象地叫做”臟讀”。
例如:在事務T1中,小明為小剛轉賬100元,在轉賬的過程中,事務未提交或者未回滾時,此時事務T2讀取到了事務T1未提交的內容,也就是說在事務T2中讀取到了小明900元,小剛1100元的記錄??梢杂孟聢D表示。
不可重復讀問題
一個事務在讀取某些數據后的某個時間,再次讀取以前讀過的數據,卻發現其讀出的數據已經發生了改變!這種現象就叫做“不可重復讀”。
指事務T2讀取數據后,事務T1執行更新操作,使T2無法讀取前一次結果。
例如,在事務T1中執行小明為小剛轉賬100元的操作,在事務未提交之前,在事務T2中讀取的數據還是小明為1000元,小剛為1000元。待事務T1提交后,事務T2中讀取的數據為小明900元,小剛1100元。如下圖所示。
幻讀問題
一個事務按相同的查詢條件重新讀取以前檢索過的數據,卻發現其他事務插入了滿足其查詢條件的新數據,這種現象就稱為“幻讀”。
事務t2讀取到了事務t1體提交的新增、刪除數據,不符合隔離性。
幻讀和不可重復讀都是讀取了另一條已經提交的事務(這點就臟讀不同),所不同的是不可重復讀查詢的都是同一個數據項,而幻讀針對的是一批數據整體(比如數據的個數)。
例如,在事務T1中插入兩條分別為小明和小剛的數據,在事務提交之前,事務T2中讀取的數據記錄為10,隨后事務T1提交,則在事務T2中讀取的記錄為12,如下所示。
并發事務問題的解決方案
為了避免上面出現的幾種情況,在標準SQL規范中,定義了4個事務隔離級別,不同的隔離級別對事務的處理不同。以下四種不同的隔離級別限制由低到高,性能從高到底。
讀未提交
讀未提交(Read Uncommitted):允許臟讀取,但不允許更新丟失。如果一個事務已經開始寫數據,則另外一個事務則不允許同時進行寫操作,但允許其他事務讀此行數據。該隔離級別可以通過“排他寫鎖”實現。
不可避免 臟讀、不可重復讀、虛讀。
讀已提交
讀已提交(Read Committed):允許不可重復讀取,但不允許臟讀取。這可以通過“瞬間共享讀鎖”和“排他寫鎖”實現。讀取數據的事務允許其他事務繼續訪問該行數據,但是未提交的寫事務將會禁止其他事務訪問該行。
可避免 臟讀,不可避免 不可重復讀、虛讀。Oracle采用讀已提交。
可重復度
可重復讀取(Repeatable Read):禁止不可重復讀取和臟讀取,但是有時可能出現幻讀數據。這可以通過“共享讀鎖”和“排他寫鎖”實現。讀取數據的事務將會禁止寫事務(但允許讀事務),寫事務則禁止任何其他事務。
可避免 臟讀、不可重復讀, 不可避免 虛讀。MySQL采用可重復讀。
序列化
序列化(Serializable):提供嚴格的事務隔離。它要求事務序列化執行,事務只能一個接著一個地執行,不能并發執行。僅僅通過“行級鎖”是無法實現事務序列化的,必須通過其他機制保證新插入的數據不會被剛執行查詢操作的事務訪問到。
可避免 臟讀、不可重復讀、幻讀情況的發生。
事務的四種隔離級別總結起來如下圖所示。
??串斍皵祿斓氖聞崭綦x級別: show variables like 'tx_isolation';
設置事務隔離級別:set tx_isolation='REPEATABLE-READ';
Mysql默認的事務隔離級別是可重復讀,用Spring開發程序時,如果不設置隔離級別默認用Mysql設置的隔離級別,如果Spring設置了就用已經設置的隔離級別
本文轉載自微信公眾號「冰河技術」,可以通過以下二維碼關注。轉載本文請聯系冰河技術公眾號。