我們一起聊聊從操作系統(tǒng)層面理解多線程沖突
前言
今天來從操作系統(tǒng)層面理解一下多線程沖突的問題,話不多說,開始~~
什么是多線程的沖突
同一進(jìn)程內(nèi)的線程是共享同一內(nèi)存空間的,所以在多個(gè)線程的進(jìn)程里,線程是可以同時(shí)操作這個(gè)進(jìn)程空間的數(shù)據(jù)的,線程之間可以共享進(jìn)程的資源:比如代碼段、堆空間、數(shù)據(jù)段、打開的文件等資源,但每個(gè)線程也有自己獨(dú)立的棧空間。如果多個(gè)線程如果競(jìng)爭(zhēng)共享資源,如果不采取有效的措施,則會(huì)造成共享數(shù)據(jù)的混亂。
舉個(gè)小栗子:一個(gè)房子里(代表一個(gè)進(jìn)程),只有一個(gè)廁所(代表共享資源)。屋子里面有兩個(gè)人A和B(代表兩個(gè)線程),共用這個(gè)廁所。一天A去上廁所了,不過廁所門的鎖壞了,就沒法鎖門。這是B也想去上廁所,直接就開門進(jìn)去了,然后發(fā)現(xiàn)A在里面。
上面這個(gè)故事說明,對(duì)于共享資源,如果沒有上鎖,在多線程的環(huán)境里,那么就可能會(huì)發(fā)生翻車現(xiàn)場(chǎng)。
競(jìng)爭(zhēng)與協(xié)作
做個(gè)小實(shí)驗(yàn),創(chuàng)建五個(gè)線程,它們分別對(duì)共享變量 i 自增 1 執(zhí)行 1000 次
package com.atguigu.juc.atomics;
public class Station{
int i = 0;
public void add() {
for(int m = 0; m < 1000; m++){
try {
//使用sleep()模擬業(yè)務(wù)時(shí)間,如果不加,大概率不會(huì)出現(xiàn)并發(fā)問題
Thread.sleep(1);
i += 1;
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
public static void main(String[] args) throws InterruptedException {
//實(shí)例化站臺(tái)對(duì)象,并為每一個(gè)站臺(tái)取名字
Station station = new Station();
new Thread(station::add,"線程1").start();
new Thread(station::add,"線程2").start();
new Thread(station::add,"線程3").start();
new Thread(station::add,"線程4").start();
new Thread(station::add,"線程5").start();
Thread.sleep(20000);
// 讓每一個(gè)站臺(tái)對(duì)象各自開始工作
System.out.println(station.i);
Thread.sleep(5000);
System.out.println(station.i);
}
}
運(yùn)行了幾次發(fā)現(xiàn),每次運(yùn)行得到不同的結(jié)果。在計(jì)算機(jī)里是不能容忍的,雖然是小概率出現(xiàn)的錯(cuò)誤,但是小概率事件它一定是會(huì)發(fā)生的。
為什么會(huì)出現(xiàn)這樣的問題呢?
為了理解為什么會(huì)發(fā)生這種情況,我們必須了解編譯器為更新計(jì)數(shù)器 i 變量生成的代碼序列,也就是要了解匯編指令的執(zhí)行順序。
在這個(gè)例子中,我們只是想給 i 加上數(shù)字 1,那么它對(duì)應(yīng)的匯編指令執(zhí)行過程是這樣的:
可以發(fā)現(xiàn),只是單純給 i 加上數(shù)字 1,在 CPU 運(yùn)行的時(shí)候,實(shí)際上要執(zhí)行 3 條指令。
設(shè)想我們的線程 1 進(jìn)入這個(gè)代碼區(qū)域,它將 i 的值(假設(shè)此時(shí)是 50 )從內(nèi)存加載到它的寄存器中,然后它向寄存器加 1,此時(shí)在寄存器中的 i 值是 51。
現(xiàn)在,一件不幸的事情發(fā)生了:當(dāng)前線程被掛起了,線程 2 被調(diào)度運(yùn)行,并進(jìn)入同一段代碼。它也執(zhí)行了第一條指令,從內(nèi)存獲取 i 值并將其放入到寄存器中,此時(shí)內(nèi)存中 i 的值仍為 50,因此線程 2 寄存器中的 i 值也是 50。假設(shè)線程 2 執(zhí)行接下來的兩條指令,將寄存器中的 i 值 + 1,然后將寄存器中的 i 值保存到內(nèi)存中,于是此時(shí)全局變量 i 值是 51。
最后,又發(fā)生一次上下文切換,線程 1 恢復(fù)執(zhí)行。還記得它已經(jīng)執(zhí)行了兩條匯編指令,現(xiàn)在準(zhǔn)備執(zhí)行最后一條指令。回憶一下, 線程 1 寄存器中的 i 值是51,因此,執(zhí)行最后一條指令后,將值保存到內(nèi)存,全局變量 i 的值再次被設(shè)置為 51。
簡(jiǎn)單來說,增加 i (值為 50 )的代碼被運(yùn)行兩次,按理來說,最后的 i 值應(yīng)該是 52,但是由于不可控的調(diào)度,導(dǎo)致最后 i 值卻是 51。
針對(duì)上面線程 1 和線程 2 的執(zhí)行過程,我畫了一張流程圖,會(huì)更明確一些:
互斥的概念
上面展示的情況稱為競(jìng)爭(zhēng)條件(race condition),當(dāng)多線程相互競(jìng)爭(zhēng)操作共享變量時(shí),由于運(yùn)氣不好,即在執(zhí)行過程中發(fā)生了上下文切換,我們得到了錯(cuò)誤的結(jié)果,事實(shí)上,每次運(yùn)行都可能得到不同的結(jié)果,因此輸出的結(jié)果存在不確定性(indeterminate)。
由于多線程執(zhí)行操作共享變量的這段代碼可能會(huì)導(dǎo)致競(jìng)爭(zhēng)狀態(tài),因此我們將此段代碼稱為臨界區(qū)(critical section),它是訪問共享資源的代碼片段,一定不能給多線程同時(shí)執(zhí)行。
我們希望這段代碼是互斥(mutualexclusion)的,也就說保證一個(gè)線程在臨界區(qū)執(zhí)行時(shí),其他線程應(yīng)該被阻止進(jìn)入臨界區(qū),說白了,就是這段代碼執(zhí)行過程中,最多只能出現(xiàn)一個(gè)線程。
另外,說一下互斥也并不是只針對(duì)多線程。在多進(jìn)程競(jìng)爭(zhēng)共享資源的時(shí)候,也同樣是可以使用互斥的方式來避免資源競(jìng)爭(zhēng)造成的資源混亂。
同步的概念
所謂同步,就是并發(fā)進(jìn)程/線程在一些關(guān)鍵點(diǎn)上可能需要互相等待與互通消息,這種相互制約的等待與互通信息稱為進(jìn)程/線程同步。
上面那個(gè)栗子:一A去上廁所了,發(fā)現(xiàn)廁所門的鎖壞了,告訴B一聲。這是B想去上廁所的話,就會(huì)先問一下A是不是還在里面,然后再開門進(jìn)去了。這也是互通消息的方式,如果鎖沒有壞,A直接把門鎖上,這就是相互等待的方式。
怎么解決多線程沖突?
為了實(shí)現(xiàn)進(jìn)程/線程間正確的協(xié)作,操作系統(tǒng)必須提供實(shí)現(xiàn)進(jìn)程協(xié)作的措施和方法,主要的方法有兩種:
- 鎖:加鎖、解鎖操作;
- 信號(hào)量:P、V 操作;
這兩個(gè)都可以方便地實(shí)現(xiàn)進(jìn)程/線程互斥,而信號(hào)量比鎖的功能更強(qiáng)一些,它還可以方便地實(shí)現(xiàn)進(jìn)程/線程同步。
鎖
使用加鎖操作和解鎖操作可以解決并發(fā)線程/進(jìn)程的互斥問題。
任何想進(jìn)入臨界區(qū)的線程,必須先執(zhí)行加鎖操作。若加鎖操作順利通過,則線程可進(jìn)入臨界區(qū);在完成對(duì)臨界資源的訪問后再執(zhí)行解鎖操作,以釋放該臨界資源。
信號(hào)量
信號(hào)量是操作系統(tǒng)提供的一種協(xié)調(diào)共享資源訪問的方法。通常信號(hào)量表示資源的數(shù)量,對(duì)應(yīng)的變量是一個(gè)整型(sem)變量。
另外,還有兩個(gè)原子操作的系統(tǒng)調(diào)用函數(shù)來控制信號(hào)量的,分別是:
- P 操作:將 sem 減 1,相減后,如果 sem < 0,則進(jìn)程/線程進(jìn)入阻塞等待,否則繼續(xù),表明 P 操作可能會(huì)阻塞;
- V 操作:將 sem 加 1,相加后,如果 sem <= 0,喚醒一個(gè)等待中的進(jìn)程/線程,表明 V 操作不會(huì)阻塞;
舉個(gè)類比,2 個(gè)資源的信號(hào)量,相當(dāng)于 2 條火車軌道,PV 操作如下圖過程: