寫給小白看的線程和進程,高手勿入
計算機的核心是CPU,它承擔了計算機的所有計算任務,CPU就像一個工廠,時刻在運行著,而操作系統管理著計算機,負責任務的調度、資源的分配和管理。
圖片來源于網絡
進程和線程都是計算機操作系統中的基本概念,在進程和線程之上有程序,應用程序是具有某種功能的程序,運行在操作系統中。
例如,我們的桌面上都會安裝QQ、酷狗音樂、微信......等,這些就是程序。當我們點擊QQ運行時,QQ正常運行,此時就會開啟一個進程。
因此,「程序是靜態的,而進程是動態的,程序是作為進程的運行的載體,進程會隨時間,會在某一時刻消亡。」
圖片來源于網絡
我們運行程序開啟的進程,我們可以在任務管理器中可以查看,當我們再次點擊QQ,登陸另一個賬號的時候又會開啟一個進程。
打個比喻:前面我們把CPU比作一個工廠,那么程序就好像工廠里面的車間。
圖片來源于網絡
但是,車間是靜態的,車間中有多條流水線,進程就好比流水線,流水線是動態執行的,一個車間可以同時運行多條流水線,也可以只執行一條流水線或者一條流水線都不執行。
總結來說:「程序可以包含多個進程,多個進程并發執行,相互獨立,因此,進程也是系統進行資源分配和調度基本單位。」
當然,程序也可以沒有啟動進程,就好比車間中沒有流水線,因為程序是靜態的,而進程的有無就好比層間的流水線是否存在。
圖片來源于網絡
一條流水線上可以有很多工人,那些工人就好比是線程,一個員工就代表一個線程,他們在一起共同協作,完成一條流水線上的任務。
圖片來源于網絡
所以,「進程與線程的關系是包含關系,一個進程中至少有一個線程,或者多個線程,一個線程只能歸屬于一個進程中」。就好比一個車間中可以有多個流水線,一條流水線上有多個功能開工,在組長安排下工人只能在一條流水線上工作。
圖片來源于網絡
當然,進程中的所有線程共享這該進程的所有資源,比如:內存空間,每個線程都可以使用這個內存空間。就好比車間中的空間都是各條流水線共享的。
不同的空間若能容納的工人也不一樣,就好比廁所一次只能一個人進廁所,當后面來的人,注意到廁所門已經關閉,就知道里面有人,就只能等候前一個人用完,他才能用。
廁所里面的人,為了防止他人再次進入廁所,就會把廁所鎖住,這就是「互斥鎖(Mutual exclusion,縮寫 Mutex)」,這就意味著在進程中的某一些空間一次只能由一條線程使用。
圖片來源于網絡
有些空間就會比較大,一次可以供多個人使用,比如:休息室,休息室的座位都是有限的,一次只能供20的座位休息,其余的人就坐不下了。
用于標識這個空間僅給20個人使用的辦法就是給每個座位打一個編號1-20,每進去一個人就給這個人發一個作為編號,當編號用完了,表示這個空間已經滿了。
圖片來源于網絡
當有人出來了就會把編號還給看守的那個人,便是又有空間可以使用了,這個做法就是「信號量」,這樣保證了每個人都有自己的座位,即保證多線程不會相互沖突。
「那為什么有進程還要多線程呢?」 每個進程都有自己獨自的代碼和數據空間,即為「程序的上下文」,進程包含多個線程,進程的切換消耗要大于線程的切換消耗。
圖片來源于網絡
線程可以看作是輕量級的進程,每個線程也有自己的「運行棧」和「程序計數器(PC)」、以及「線程的本地存儲」,所以對于進程數比較多的,頻繁的切換進程將會帶來一大筆的開銷,反而線程的切換開銷小。
圖片來源于網絡
進程是一個「動態」的概念,進程包含下面的五種狀態:「初始態,執行態,等待狀態,就緒狀態,終止狀態」。
圖片來源于網絡
線程中的狀態也是包含下面的五種:「新建(NEW)、可運行(Runnable)、運行(Running)、阻塞(BLOCKED)、死亡(DEAD)」。
圖片來源于網絡
那么進程之間是怎么交互的呢?在進程之間的通信包括「管道、系統IPC(包括消息隊列,信號量,共享存儲), SOCKET。」
管道的方式由包括以下三種方式:
- 「普通管道」PIPE:通常會有限制,可能是半雙工方式,或者是只能在子父進程中使用。
- 「流管道」s_pipe:可以使用雙向傳輸。
- 「命名管道」name_pipe:它允許可以在不相關的進程之中使用。
線程之間的通信在JMM模型中是通過共享內存來實現的,例如:線程一要和線程二通信,線程一先把自己的變量副本寫入主內存中,然后線程二再從主內存中讀取該變量,復制到自己的線程空間中進行操作,線程都不能直接操作主內存。
為了保證多線程之間的數據一致性的問題,可以使用鎖機制,實現線程之間的操作的同步、有序。例如:「synchronized鎖、Lock鎖、Atomic原子類」。
單線程時代,一次只能執行一個任務,后面的任務只能排隊等候,實現的方式都是串行化的,隨著后續的發展為了提高效率,實現了多線程。
單CPU的多線程方式,實現的是并發方式,并發真正意義上的并行,因為CPU一次只能執行一次任務,但是,CPU的執行速度遠快于線程的執行速度,為了充分利用CPU,因此實現并發的多線程方式。
圖片來源于網絡
多CPU時代的來領,實現真正意義上的并行多線程,同一時刻可以由多個線程的執行。
圖片來源于網絡
最后總結:「操作系統中是以多進程的形式執行,以多線程的方式執行,允許講單個任務由多個部分執行,并且在多線程之間能夠提供協調機制,允許進程之間、線程之間有共享的部分,又能夠保證進程之間、線程之間不會相互影響」。