MESI協議,JMM,線程常見方法等

作者：學習Java的小姐姐 2020-06-09 08:11:33

網絡網絡管理

我們在找工作時，經常在招聘信息上看到有這么一條:要求多線程并發經驗。無論是初級程序員，中級程序員，高級程序員，也無論是大廠，小廠，并發編程肯定是少不了的。

[[329428]]

本文轉載自微信公眾號「學習Java的小姐姐」，轉載本文請聯系學習Java的小姐姐公眾號。

前言

但是網上很多博文直接上來就講JUC，沒有從基礎出發，所以該篇旨在講明并發基礎，主要為計算機原理，線程常見方法，Java虛擬機方法的知識，為后面的學習保駕護航，話不多說，開始吧。

緩存一致性——MESI協議

CPU多級緩存官方概念

CPU在摩爾定律的指導下以每18個月翻一番的速度在發展，然而內存和硬盤的發展速度遠遠不及CPU，所以才引入了緩存的概念。我們可以從下圖看出在CPU和主內存之間加了一個緩存，用來提升交互速度。

隨著CPU的速率越來越快，人們對計算機性能要求越來越高，傳統的緩存已經滿足不了，所以引入了多級緩存，包括一級緩存，二級緩存，三級緩存，具體如圖所示。

一級緩存：基本上都是內置在cpu內部，和cpu一個速度運行，能有效的提升cpu的工作效率。當然數量越多，cpu工作效率就會越高，但是由于cpu的內部結構限制了其大小，所以一級緩存的數據并不大。

二級緩存：主要作用是協調一級緩存和內存之間的工作效率。cpu首先用的是一級內存，當cpu的速度慢慢提升之后，一級緩存就不夠cpu的使用量了，這就需要用到二級內存。

三級緩存：和一級緩存與二級緩存的關系差不多，是為了在讀取二級緩存不夠用的時候而設計的一種緩存手段，在有三級緩存cpu之中，只有大約百分之五的數據需要在內存中調取使用，這能提升cpu不少的效率，從而cpu能夠高速的工作。

我們可以看下本機的緩存情況。

CPU多級緩存白話翻譯

只有一級緩存情況：

我們可以將CPU當做我們本人，緩存區當做超市，主內存當做工廠，如果想要買東西(取數據)就先去超市(緩存區)買(取)，如果超市(緩存區)沒有，就去工廠(主內存)里面買(取)。

多級緩存情況：

我們可以將CPU當做本人，一級緩存當做樓下小區里面的小賣部，二級緩存當做普通超市，三級緩存當做大型超市，主內存當做工廠，如果想買東西先去樓下小賣部(一級緩存)，小賣部(一級緩存)沒有的話，就去普通超市(二級緩存)，如果普通超市(二級緩存)還沒有，就去大型超市(三級緩存)，如果大型超市(三級緩存)還沒有，就直接去工廠(主內存)取。這些緩存的出現使得我們不必每次都去工廠(主內存)買東西(取數據)，節省了時間，提升了速度。

為什么需要CPU緩存

CPU速率太快，快到內存跟不上，在處理器處理周期內，CPU常常等待內存，造成資源的浪費。

緩存的意義

時間局限性：如果某個數據被訪問，在將來的某個時間也可能被訪問。(白話翻譯就是如果我今天買了薯片，那么以后我可能還會買薯片，畢竟是吃貨O(∩_∩)O)

空間局限性：如果某個數據被訪問，那么他相鄰的數據也有可能被訪問。(白話翻譯就是如果我今天買了薯片，那么我可以還會買其他膨化食品，畢竟他們兩挨在一起)

帶來的問題

對于多核系統來說，每個核中緩存數據不一致的問題。

解決方式一——總線加鎖(性能太低)

CPU從主內存讀取數據到緩存區，并在總線對這個數據進行加鎖，其他CPU無法去讀寫這個數據，直到這個CPU使用完數據，鎖被釋放了才訪問。就比如我想去超市買一個辣條，但是張三也想買，在我買的過程中，就給辣條加了鎖，張三根本碰不到辣條，我買的過程非常慢，那張三不急死啦嘛。

解決方式二——MESI協議(重點)

針對上面緩存數據不一致的情況，提出了MESI協議用以保證多個CPU緩存中共享數據的一致性，定義了緩存行Cache Line四個狀態，分表是M(Modified)，E(Exclusive)，S(Share)，I(Invalid)四種。

M(Modified修改)：該行數據有效，數據被修改了，和內存中的數據不一致，數據只能存在于本緩沖區中。
E(Exclusive獨占)：這行數據有效，數據和內存中的數據一致，數據只存在于本Cache中。
S(Shared共享)：這行數據有效，數據和內存中的數據一致，數據存在于很多Cache中。
I(Invalid無效)：這行數據無效

MESI狀態之間的遷移：

這圖一看是很懵逼的，咱慢慢來看哈，慢慢體會這些變化哈。

當前狀態是Modified

內核讀取本地緩存中的值(local read)：從緩存區中讀取數據，狀態不變，還是修改M
本地內核寫本地緩存中的值(local write)：從緩存區中修改數據，狀態不變，還是修改M
其它內核讀取其他緩存中的值(remote read)：數據被寫入內存，其他內存讀取到最新數據，即為共享S
其它內核更改其他緩存中的值(remote write)：數據被寫入內存，其他內存讀取到最新數據，并修改和提交，此緩存區的狀態為無效I

當前狀態是Exclusive

內核讀取本地緩存中的值(local read)：從緩存區中讀取數據，狀態不變，還是獨占E
本地內核寫本地緩存中的值(local write)：從緩存區中修改數據，即為修改M
其它內核讀取其他緩存中的值(remote read)：數據被寫入內存，其他內存讀取到數據，即為共享S
其它內核更改其他緩存中的值(remote write)：數據被寫入內存，其他內存讀取到數據，并修改提交，即為無效I

當前狀態是Share

內核讀取本地緩存中的值(local read)：從緩存區中讀取數據，狀態不變，還是共享S
本地內核寫本地緩存中的值(local write)：在緩存區中修改數據，即為修改M
其它內核讀取其他緩存中的值(remote read)：數據被寫入內存，其他內存讀取數據，即為共享S
其它內核更改其他緩存中的值(remote write)：數據被寫入內存，其他內存讀取數據，并修改提交，即為無效I

當前狀態是Invalid

內核讀取本地緩存中的值(local read)：如果其他緩存里面沒有這個值，狀態即為獨享E;如果其他緩存里有這個值，狀態即為共享S
本地內核寫本地緩存中的值(local write)：在緩存區中修改數據，即為修改M
其它內核讀取其他緩存中的值(remote read)：其他核的操作與他無關，即為無效I
其它內核更改其他緩存中的值(remote write)：其他核的操作與他無關，即為無效I

并行和并發的區別

并發：同一時刻只能有一個指令執行，但多個指令被CPU輪換執行，因為時間間隔很短，會造成同時執行的錯覺。

并行：同一時刻多條指令在多個處理器同時執行，不管是微觀，還是宏觀上，都是同時執行的。

舉個例子，并發就是一個家庭主婦既要燒飯，也要帶娃，也要打掃房間，如果每個事情只做一分鐘，然后輪換，從宏觀上來說，會造成同時執行的錯覺。并行就是該家庭主婦請了兩個保姆，一個專職負責燒飯，一個專職負責帶娃，自己專職負責打掃衛生，不管從宏觀還是微觀上來看，他們都是同時執行的。

某位大佬曾經說兩者的區別，并發是同一時間應對多件事情的能力，并行是同一時間去做多件事情的能力。作為一個工科生，不知道如何夸大佬，只知道喊666。

進程和線程的關系

進程是用來加載指令，管理內存，執行語句的。

線程是進程的一部分，一個進程可以分為1個或多個線程。

網易云音樂的打開，就是開啟了一個進程，而播放，查找，評論等都是線程。

線程之間的通信

線程之間的通信比較簡單，可以通過他們的共享內存通信，具體可以看下面Java內存模式部分。

進程之間的通信

進程之間的通信比較復雜，對于同一臺計算機而言，其通信稱為IPC;對于不同計算機，其通信需要網絡并遵循彼此約定的協議，如HTTP等。這部分偏硬件，咱也不敢說，咱也不敢問。

線程的狀態(從硬件層面)

初始狀態：新建new一個線程，還沒有進行任何步驟，還未和硬件關聯上。

可運行狀態：當調用start方法，即進行可運行狀態(就緒狀態)，但是這個時候還沒獲取到時間片，具體什么時候運行取決于硬件。

運行狀態：當CPU分配的時間片到某個線程了，該線程即可進入運行狀態。

阻塞狀態：當線程調用阻塞API，線程并沒有用到CPU，其進入阻塞狀態。

終止狀態：當一個線程運行結束了，即進入終止狀態。

一些常見的線程操作

創建線程的三種方式

線程和任務合并

Thread thread=new Thread(){       
 public void run(){       
     System.out.println("開始");   
 }  
};

線程和任務分開

 Runnable runnable=new Runnable() {        
      @Override            
      public void run() {       
         System.out.println("開始");            
      }        
};  
Thread thread=new Thread(runnable);

FutureTask返回執行結果

FutureTask<String> futureTask=new FutureTask<String>(new Callable<String>() {           
   @Override      
        public String call() throws Exception {     
             return "線程的返回值";       
    }         
});  
Thread thread=new Thread(futureTask);

線程啟動start

thread.start();

這里start是進入就緒狀態，即可運行狀態，具體什么時候要看CPU。

等待線程運行結束join

未加join情況：

 Runnable runnable=new Runnable() {             
 @Override            
  public void run() {   
        System.out.println("線程開始");       
        try {         
             sleep(4000L);            
        } catch (InterruptedException e) {    
             e.printStackTrace();               
        }           
         System.out.println("線程結束");     
     }     
 };  
//創建線程  
Thread thread=new Thread(runnable);  
//啟動線程 
 System.out.println("主線程開始"); 
 thread.start(); 
 System.out.println("主線程結束");

運行結果：

使用join的情況：

Runnable runnable=new Runnable() {         
@Override   
 public void run() {    
        System.out.println("線程開始");     
        try {         
             sleep(4000L);         
        } catch (InterruptedException e) {   
              e.printStackTrace();      
        }       
        System.out.println("線程結束");        
  }  
};  
 //創建線程    
hread thread=new Thread(runnable);   
//啟動線程   
System.out.println("主線程開始");   
thread.start();   
thread.join();   
System.out.println("主線程結束");

運行結果：

沒有用join方法的第一情況，主線程開始和主線程結束都在前面，并靠在一起，而線程開始和線程結束則在后面，因為他們是兩個不同的線程，彼此互不干擾。而用了join方法的第二種情況，主線程結束在最后一行，因為join方法需要等待子線程結束后才能繼續執行后面代碼。

獲取線程id，name，priority

 //創建線程  Thread thread=new Thread(){       
  public void run(){      
       System.out.println("線程開始");      
   } 
};   
//啟動線程  
thread.start();   
System.out.println("id："+thread.getId());   
System.out.println("name："+thread.getName());   
System.out.println("priority："+thread.getPriority());

運行結果：

Java內存模型——JMM

內存模型

跟多級緩存差不多意思，每個線程里面都有工作內存，其存儲的是主內存中數據的副本，如下圖。那如果主內存中有變量a=1，現在線程A,B,C都存了a=1的副本，線程A對其進行加1操作，并刷新到主內存。可是線程B，C并不知道這種情況，那么就出問題啦。那如何解決這個問題呢?下面將慢慢說，不急。

8種原子操作(概念)

下面羅列的是8種原子操作，大家大概看看，下面將詳細描述。

read(讀取)：從主內存中讀取數據
load(載入)：將主內存讀取到的數據寫入工作內存
user(使用)：從工作內存讀取數據來計算
assign(賦值)：將計算好的值重新賦值到工作內存中
store(存儲)：將工作內存數據寫入主內存
write(寫入)：將store過去的變量值賦值給主內存中的變量
lock(鎖定)：將主內存變量加鎖，標識為線程獨占狀態
unlock(解鎖)：將主內存變量解鎖，解鎖后其他線程可以鎖定該變量

8種原子操作(舉例)

咱以上面的例子畫了個圖，請原諒偶我笨，畫的丑了點。

1.read讀取：將主內存中的a=1讀取出來。

2.load載入：將從主內存中a=1載入到線程A的工作內存中。

3.use使用：將線程A工作內存的a=1讀取到，并進行自增操作。

4.assign賦值：將a=2寫入到線程A的工作內存中。

5.store存儲：將a=2存儲到主內存中。

6.write寫入：將a=2寫入到主內存的a變量中。

7.lock鎖定：在上面CPU緩存解決不一致的方法一中，線程A操作的時候，對主內存a變量進行加鎖操作(lock)，線程B根本讀不了a變量。

8.unlock解鎖：線程A操作解鎖之后，對主內存a變量進行解鎖操作(unlock)，線程B可以讀到a變量并對其操作。

注意：lock和unlock存在著一個性能問題，我們發現寫的代碼明明是多線程并發操作，但是底層還是串行化，并沒有真正實現并發。

可見性原理

上面說的MESI協議是在總線那邊實踐的，線程A，B可以同時獲取主內存a的值，a進行自增操作之后在進行操作6write寫入的時候，會經過總線。線程B一直使用嗅探監控總線中自己感興趣的變量a，一旦發現a值有修改，立刻將自己工作內存中a置為無效Invalid(利用MESI協議)，并立刻從主內存中讀取a值，這個時候總線中a還沒有寫入內存，所以有個短暫的lock過程，等到a寫入內存了，進行unlock操作，線程B即可讀取新的a值。

該過程雖然也有lock與unlock操作，但是鎖的粒度降低啦。

并發的風險與優勢

優勢：

速度方面：同時處理多個請求，響應更快，復雜的操作可以分成多個進程同時進行。
設計方面：程序設計在某些情況下更簡單，也可以有更多的選擇。
資源利用方面：CPU能夠在等待IO的時候做一些其他的事情。

風險:

安全性方面：多個線程共享數據時可能會產生與期望不相符的結果。
活躍性方面：某個操作無法繼續進行下去時，就會發生活躍性問題，比如死鎖，節等問題。
性能方面：線程過多時會使得：CPU頻繁切換，調度時間增多;同步機制;消耗過多內存。

結語

看到這里的都是真愛，先行謝過。此篇是并發系列的基礎，主要聊了硬件的MESI協議，原子的八種操作，線程和進程的關系，線程的一些基礎操作，JMM的基礎等。

責任編輯：武曉燕來源：學習Java的小姐姐0618

MESI 協議 MM

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

MESI協議,JMM,線程常見方法等