徹底搞懂Java線程池的工作原理
前言
多線程并發(fā)是Java語(yǔ)言中非常重要的一塊內(nèi)容,同時(shí),也是Java基礎(chǔ)的一個(gè)難點(diǎn)。說(shuō)它重要是因?yàn)槎嗑€程是日常開(kāi)發(fā)中頻繁用到的知識(shí),說(shuō)它難是因?yàn)槎嗑€程并發(fā)涉及到的知識(shí)點(diǎn)非常之多,想要完全掌握J(rèn)ava的并發(fā)相關(guān)知識(shí)并非易事。也正因此,Java并發(fā)成了Java面試中最高頻的知識(shí)點(diǎn)之一。
本篇文章將深入分析Java中線程池的工作原理。個(gè)人認(rèn)為線程池是Java并發(fā)中比較難已理解的一塊知識(shí),因?yàn)榫€程池內(nèi)部實(shí)現(xiàn)使用到了大量的像ReentrantLock、AQS、AtomicInteger、CAS以及“生產(chǎn)者-消費(fèi)者”模型等并發(fā)相關(guān)的知識(shí),基本上涵蓋了并發(fā)系列前幾篇文章的大部分知識(shí)點(diǎn)。這也是為什么把線程池放到最后來(lái)寫(xiě)的原因。本篇文章權(quán)當(dāng)是一個(gè)并發(fā)系列的綜合練習(xí),剛好鞏固實(shí)踐一下前面知識(shí)點(diǎn)的運(yùn)用。
線程池基礎(chǔ)知識(shí)
在Java語(yǔ)言中,雖然創(chuàng)建并啟動(dòng)一個(gè)線程非常方便,但是由于創(chuàng)建線程需要占用一定的操作系統(tǒng)資源,在高并發(fā)的情況下,頻繁的創(chuàng)建和銷毀線程會(huì)大量消耗CPU和內(nèi)存資源,對(duì)程序性能造成很大的影響。為了避免這一問(wèn)題,Java給我們提供了線程池。
線程池是一種基于池化技術(shù)思想來(lái)管理線程的工具。在線程池中維護(hù)了多個(gè)線程,由線程池統(tǒng)一的管理調(diào)配線程來(lái)執(zhí)行任務(wù)。通過(guò)線程復(fù)用,減少了頻繁創(chuàng)建和銷毀線程的開(kāi)銷。
本章內(nèi)容我們先來(lái)了解一下線程池的一些基礎(chǔ)知識(shí),學(xué)習(xí)如何使用線程池以及了解線程池的生命周期。
線程池的使用
線程池的使用和創(chuàng)建可以說(shuō)非常的簡(jiǎn)單,這得益于JDK提供給我們良好封裝的API。線程池的實(shí)現(xiàn)被封裝到了ThreadPoolExecutor中,我們可以通過(guò)ThreadPoolExecutor的構(gòu)造方法來(lái)實(shí)例化出一個(gè)線程池,代碼如下:
- // 實(shí)例化一個(gè)線程池
- ThreadPoolExecutor executor = new ThreadPoolExecutor(3, 10, 60,
- TimeUnit.SECONDS, new ArrayBlockingQueue<>(20));
- // 使用線程池執(zhí)行一個(gè)任務(wù)
- executor.execute(() -> {
- // Do something
- });
- // 關(guān)閉線程池,會(huì)阻止新任務(wù)提交,但不影響已提交的任務(wù)
- executor.shutdown();
- // 關(guān)閉線程池,阻止新任務(wù)提交,并且中斷當(dāng)前正在運(yùn)行的線程
- executor.showdownNow();
創(chuàng)建好線程池后直接調(diào)用execute方法并傳入一個(gè)Runnable參數(shù)即可將任務(wù)交給線程池執(zhí)行,通過(guò)shutdown/shutdownNow方法可以關(guān)閉線程池。
ThreadPoolExecutor的構(gòu)造方法中參數(shù)眾多,對(duì)于初學(xué)者而言在沒(méi)有了解各個(gè)參數(shù)的作用的情況下很難去配置合適的線程池。因此Java還為我們提供了一個(gè)線程池工具類Executors來(lái)快捷的創(chuàng)建線程池。Executors提供了很多簡(jiǎn)便的創(chuàng)建線程池的方法,舉兩個(gè)例子,代碼如下:
- // 實(shí)例化一個(gè)單線程的線程池
- ExecutorService singleExecutor = Executors.newSingleThreadExecutor();
- // 創(chuàng)建固定線程個(gè)數(shù)的線程池
- ExecutorService fixedExecutor = Executors.newFixedThreadPool(10);
- // 創(chuàng)建一個(gè)可重用固定線程數(shù)的線程池
- ExecutorService executorService2 = Executors.newCachedThreadPool();
但是,通常來(lái)說(shuō)在實(shí)際開(kāi)發(fā)中并不推薦直接使用Executors來(lái)創(chuàng)建線程池,而是需要根據(jù)項(xiàng)目實(shí)際情況配置適合自己項(xiàng)目的線程池,關(guān)于如何配置合適的線程池這是后話,需要我們理解線程池的各個(gè)參數(shù)以及線程池的工作原理之后才能有答案。
線程池的生命周期
線程池從誕生到死亡,中間會(huì)經(jīng)歷RUNNING、SHUTDOWN、STOP、TIDYING、TERMINATED五個(gè)生命周期狀態(tài)。
- RUNNING 表示線程池處于運(yùn)行狀態(tài),能夠接受新提交的任務(wù)且能對(duì)已添加的任務(wù)進(jìn)行處理。RUNNING狀態(tài)是線程池的初始化狀態(tài),線程池一旦被創(chuàng)建就處于RUNNING狀態(tài)。
- SHUTDOWN 線程處于關(guān)閉狀態(tài),不接受新任務(wù),但可以處理已添加的任務(wù)。RUNNING狀態(tài)的線程池調(diào)用shutdown后會(huì)進(jìn)入SHUTDOWN狀態(tài)。
- STOP 線程池處于停止?fàn)顟B(tài),不接收任務(wù),不處理已添加的任務(wù),且會(huì)中斷正在執(zhí)行任務(wù)的線程。RUNNING狀態(tài)的線程池調(diào)用了shutdownNow后會(huì)進(jìn)入STOP狀態(tài)。
- TIDYING 當(dāng)所有任務(wù)已終止,且任務(wù)數(shù)量為0時(shí),線程池會(huì)進(jìn)入TIDYING。當(dāng)線程池處于SHUTDOWN狀態(tài)時(shí),阻塞隊(duì)列中的任務(wù)被執(zhí)行完了,且線程池中沒(méi)有正在執(zhí)行的任務(wù)了,狀態(tài)會(huì)由SHUTDOWN變?yōu)門IDYING。當(dāng)線程處于STOP狀態(tài)時(shí),線程池中沒(méi)有正在執(zhí)行的任務(wù)時(shí)則會(huì)由STOP變?yōu)門IDYING。
- TERMINATED 線程終止?fàn)顟B(tài)。處于TIDYING狀態(tài)的線程執(zhí)行terminated()后進(jìn)入TERMINATED狀態(tài)。
根據(jù)上述線程池生命周期狀態(tài)的描述,可以畫(huà)出如下所示的線程池生命周期狀態(tài)流程示意圖。
線程池的工作機(jī)制
ThreadPoolExecutor中的參數(shù)
上一小節(jié)中,我們使用ThreadPoolExecutor的構(gòu)造方法來(lái)創(chuàng)建了一個(gè)線程池。其實(shí)在ThreadPoolExecutor中有多個(gè)構(gòu)造方法,但是最終都調(diào)用到了下邊代碼中的這一個(gè)構(gòu)造方法:
- public class ThreadPoolExecutor extends AbstractExecutorService {
- public ThreadPoolExecutor(int corePoolSize,
- int maximumPoolSize,
- long keepAliveTime,
- TimeUnit unit,
- BlockingQueue<Runnable> workQueue,
- ThreadFactory threadFactory,
- RejectedExecutionHandler handler) {
- // ...省略校驗(yàn)相關(guān)代碼
- this.corePoolSize = corePoolSize;
- this.maximumPoolSize = maximumPoolSize;
- this.workQueue = workQueue;
- this.keepAliveTime = unit.toNanos(keepAliveTime);
- this.threadFactory = threadFactory;
- this.handler = handler;
- }
- // ...
- }
這個(gè)構(gòu)造方法中有7個(gè)參數(shù)之多,我們逐個(gè)來(lái)看每個(gè)參數(shù)所代表的含義:
- corePoolSize 表示線程池的核心線程數(shù)。當(dāng)有任務(wù)提交到線程池時(shí),如果線程池中的線程數(shù)小于corePoolSize,那么則直接創(chuàng)建新的線程來(lái)執(zhí)行任務(wù)。
- workQueue 任務(wù)隊(duì)列,它是一個(gè)阻塞隊(duì)列,用于存儲(chǔ)來(lái)不及執(zhí)行的任務(wù)的隊(duì)列。當(dāng)有任務(wù)提交到線程池的時(shí)候,如果線程池中的線程數(shù)大于等于corePoolSize,那么這個(gè)任務(wù)則會(huì)先被放到這個(gè)隊(duì)列中,等待執(zhí)行。
- maximumPoolSize 表示線程池支持的最大線程數(shù)量。當(dāng)一個(gè)任務(wù)提交到線程池時(shí),線程池中的線程數(shù)大于corePoolSize,并且workQueue已滿,那么則會(huì)創(chuàng)建新的線程執(zhí)行任務(wù),但是線程數(shù)要小于等于maximumPoolSize。
- keepAliveTime 非核心線程空閑時(shí)保持存活的時(shí)間。非核心線程即workQueue滿了之后,再提交任務(wù)時(shí)創(chuàng)建的線程,因?yàn)檫@些線程不是核心線程,所以它空閑時(shí)間超過(guò)keepAliveTime后則會(huì)被回收。
- unit 非核心線程空閑時(shí)保持存活的時(shí)間的單位
- threadFactory 創(chuàng)建線程的工廠,可以在這里統(tǒng)一處理創(chuàng)建線程的屬性
- handler 拒絕策略,當(dāng)線程池中的線程達(dá)到maximumPoolSize線程數(shù)后且workQueue已滿的情況下,再向線程池提交任務(wù)則執(zhí)行對(duì)應(yīng)的拒絕策略
線程池工作流程
線程池提交任務(wù)是從execute方法開(kāi)始的,我們可以從execute方法來(lái)分析線程池的工作流程。
(1)當(dāng)execute方法提交一個(gè)任務(wù)時(shí),如果線程池中線程數(shù)小于corePoolSize,那么不管線程池中是否有空閑的線程,都會(huì)創(chuàng)建一個(gè)新的線程來(lái)執(zhí)行任務(wù)。
(2)當(dāng)execute方法提交一個(gè)任務(wù)時(shí),線程池中的線程數(shù)已經(jīng)達(dá)到了corePoolSize,且此時(shí)沒(méi)有空閑的線程,那么則會(huì)將任務(wù)存儲(chǔ)到workQueue中。
(3)如果execute提交任務(wù)時(shí)線程池中的線程數(shù)已經(jīng)到達(dá)了corePoolSize,并且workQueue已滿,那么則會(huì)創(chuàng)建新的線程來(lái)執(zhí)行任務(wù),但總線程數(shù)應(yīng)該小于maximumPoolSize。
(4)如果線程池中的線程執(zhí)行完了當(dāng)前的任務(wù),則會(huì)嘗試從workQueue中取出第一個(gè)任務(wù)來(lái)執(zhí)行。如果workQueue為空則會(huì)阻塞線程。
(5)如果execute提交任務(wù)時(shí),線程池中的線程數(shù)達(dá)到了maximumPoolSize,且workQueue已滿,此時(shí)會(huì)執(zhí)行拒絕策略來(lái)拒絕接受任務(wù)。
(6)如果線程池中的線程數(shù)超過(guò)了corePoolSize,那么空閑時(shí)間超過(guò)keepAliveTime的線程會(huì)被銷毀,但程池中線程個(gè)數(shù)會(huì)保持為corePoolSize。
(7)如果線程池存在空閑的線程,并且設(shè)置了allowCoreThreadTimeOut為true。那么空閑時(shí)間超過(guò)keepAliveTime的線程都會(huì)被銷毀。
線程池的拒絕策略
如果線程池中的線程數(shù)達(dá)到了maximumPoolSize,并且workQueue隊(duì)列存儲(chǔ)滿的情況下,線程池會(huì)執(zhí)行對(duì)應(yīng)的拒絕策略。在JDK中提供了RejectedExecutionHandler接口來(lái)執(zhí)行拒絕操作。實(shí)現(xiàn)RejectedExecutionHandler的類有四個(gè),對(duì)應(yīng)了四種拒絕策略。分別如下:DiscardPolicy 當(dāng)提交任務(wù)到線程池中被拒絕時(shí),線程池會(huì)丟棄這個(gè)被拒絕的任務(wù)
- DiscardOldestPolicy 當(dāng)提交任務(wù)到線程池中被拒絕時(shí),線程池會(huì)丟棄等待隊(duì)列中最老的任務(wù)。
- CallerRunsPolicy 當(dāng)提交任務(wù)到線程池中被拒絕時(shí),會(huì)在線程池當(dāng)前正在運(yùn)行的Thread線程中處理被拒絕額任務(wù)。即哪個(gè)線程提交的任務(wù)哪個(gè)線程去執(zhí)行。
- AbortPolicy 當(dāng)提交任務(wù)到線程池中被拒絕時(shí),直接拋出RejectedExecutionException異常。
線程池源碼分析
從上一章對(duì)線程池的工作流程解讀來(lái)看,線程池的原理似乎并沒(méi)有很難。但是開(kāi)篇時(shí)我說(shuō)過(guò)想要讀懂線程池的源碼并不容,主要原因是線程池內(nèi)部運(yùn)用到了大量并發(fā)相關(guān)知識(shí),另外還與線程池中用到的位運(yùn)算有關(guān)。
線程池中的位運(yùn)算(了解內(nèi)容)
在向線程池提交任務(wù)時(shí)有兩個(gè)比較中要的參數(shù)會(huì)決定任務(wù)的去向,這兩個(gè)參數(shù)分別是線程池的狀態(tài)和線程池中的線程數(shù)。在ThreadPoolExecutor內(nèi)部使用了一個(gè)AtomicInteger類型的整數(shù)ctl來(lái)表示這兩個(gè)參數(shù),代碼如下:
- public class ThreadPoolExecutor extends AbstractExecutorService {
- // Integer.SIZE = 32.所以 COUNT_BITS= 29
- private static final int COUNT_BITS = Integer.SIZE - 3;
- // 00001111 11111111 11111111 11111111 這個(gè)值可以表示線程池的最大線程容量
- private static final int COUNT_MASK = (1 << COUNT_BITS) - 1;
- // 將-1左移29位得到RUNNING狀態(tài)的值
- private static final int RUNNING = -1 << COUNT_BITS;
- // 線程池運(yùn)行狀態(tài)和線程數(shù)
- private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
- private static int ctlOf(int rs, int wc) { return rs | wc; }
- // ...
- }
因?yàn)樯婕岸嗑€程的操作,這里為了保證原子性,ctl參數(shù)使用了AtomicInteger類型,并且通過(guò)ctlOf方法來(lái)計(jì)算出了ctl的初始值。如果你不了解位運(yùn)算大概很難理解上述代碼的用意。
我們知道,int類型在Java中占用4byte的內(nèi)存,一個(gè)byte占用8bit,所以Java中的int類型共占用32bit。對(duì)于這個(gè)32bit,我們可以進(jìn)行高低位的拆分。做Android開(kāi)發(fā)的同學(xué)應(yīng)該都了解View測(cè)量流程中的MeasureSpec參數(shù),這個(gè)參數(shù)將32bit的int拆分成了高2位和低30位,分別表示View的測(cè)量模式和測(cè)量值。而這里的ctl與MeasureSpec類似,ctl將32位的int拆分成了高3位和低29位,分別表示線程池的運(yùn)行狀態(tài)和線程池中的線程個(gè)數(shù)。
下面我們通過(guò)位運(yùn)算來(lái)驗(yàn)證一下ctl是如何工作的,當(dāng)然,如果你不理解這個(gè)位運(yùn)算的過(guò)程對(duì)理解線程池的源碼影響并不大,所以對(duì)以下驗(yàn)證內(nèi)容不感興趣的同學(xué)可以直接略過(guò)。
可以看到上述代碼中RUNNING的值為-1左移29位,我們知道在計(jì)算機(jī)中**負(fù)數(shù)是以其絕對(duì)值的補(bǔ)碼來(lái)表示的,而補(bǔ)碼是由反碼加1得到。**因此-1在計(jì)算機(jī)中存儲(chǔ)形式為1的反碼+1。
- 1的原碼:00000000 00000000 00000000 00000001
- +
- 1的反碼:11111111 11111111 11111111 11111110
- ---------------------------------------
- -1存儲(chǔ): 11111111 11111111 11111111 11111111
接下來(lái)對(duì)-1左移29位可以得到RUNNING的值為:
- // 高三位表示線程狀態(tài),即高三位為111表示RUNNING
- 11100000 00000000 00000000 00000000
而AtomicInteger初始線程數(shù)量是0,因此ctlOf方法中的“|”運(yùn)算如下:
- RUNNING: 11100000 00000000 00000000 00000000
- |
- 線程數(shù)為0: 00000000 00000000 00000000 00000000
- ---------------------------------------
- 得到ctl: 11100000 00000000 00000000 00000000
通過(guò)RUNNING|0(線程數(shù))即可得到ctl的初始值。同時(shí)還可以通過(guò)以下方法將ctl拆解成運(yùn)行狀態(tài)和線程數(shù):
- // 00001111 11111111 11111111 11111111
- private static final int COUNT_MASK = (1 << COUNT_BITS) - 1;
- // 獲取線程池運(yùn)行狀態(tài)
- private static int runStateOf(int c) { return c & ~COUNT_MASK; }
- // 獲取線程池中的線程數(shù)
- private static int workerCountOf(int c) { return c & COUNT_MASK; }
假設(shè)此時(shí)線程池為RUNNING狀態(tài),且線程數(shù)為0,驗(yàn)證一下runStateOf是如何得到線程池的運(yùn)行狀態(tài)的:
- COUNT_MASK: 00001111 11111111 11111111 11111111
- ~COUNT_MASK: 11110000 00000000 00000000 00000000
- &
- ctl: 11100000 00000000 00000000 00000000
- ----------------------------------------
- RUNNING: 11100000 00000000 00000000 00000000
如果不理解上邊的驗(yàn)證流程沒(méi)有關(guān)系,只要知道通過(guò)runStateOf方法可以得到線程池的運(yùn)行狀態(tài),通過(guò)workerCountOf可以得到線程池中的線程數(shù)即可。
接下來(lái)我們進(jìn)入線程池的源碼的源碼分析環(huán)節(jié)。
ThreadPoolExecutor的execute
向線程池提交任務(wù)的方法是execute方法,execute方法是ThreadPoolExecutor的核心方法,以此方法為入口來(lái)進(jìn)行剖析,execute方法的代碼如下:
- public void execute(Runnable command) {
- if (command == null)
- throw new NullPointerException();
- // 獲取ctl的值
- int c = ctl.get();
- // 1.線程數(shù)小于corePoolSize
- if (workerCountOf(c) < corePoolSize) {
- // 線程池中線程數(shù)小于核心線程數(shù),則嘗試創(chuàng)建核心線程執(zhí)行任務(wù)
- if (addWorker(command, true))
- return;
- c = ctl.get();
- }
- // 2.到此處說(shuō)明線程池中線程數(shù)大于核心線程數(shù)或者創(chuàng)建線程失敗
- if (isRunning(c) && workQueue.offer(command)) {
- // 如果線程是運(yùn)行狀態(tài)并且可以使用offer將任務(wù)加入阻塞隊(duì)列未滿,offer是非阻塞操作。
- int recheck = ctl.get();
- // 重新檢查線程池狀態(tài),因?yàn)樯洗螜z測(cè)后線程池狀態(tài)可能發(fā)生改變,如果非運(yùn)行狀態(tài)就移除任務(wù)并執(zhí)行拒絕策略
- if (! isRunning(recheck) && remove(command))
- reject(command);
- // 如果是運(yùn)行狀態(tài),并且線程數(shù)是0,則創(chuàng)建線程
- else if (workerCountOf(recheck) == 0)
- // 線程數(shù)是0,則創(chuàng)建非核心線程,且不指定首次執(zhí)行任務(wù),這里的第二個(gè)參數(shù)其實(shí)沒(méi)有實(shí)際意義
- addWorker(null, false);
- }
- // 3.阻塞隊(duì)列已滿,創(chuàng)建非核心線程執(zhí)行任務(wù)
- else if (!addWorker(command, false))
- // 如果失敗,則執(zhí)行拒絕策略
- reject(command);
- }
execute方法中的邏輯可以分為三部分:
- 1.如果線程池中的線程數(shù)小于核心線程,則直接調(diào)用addWorker方法創(chuàng)建新線程來(lái)執(zhí)行任務(wù)。
- 2.如果線程池中的線程數(shù)大于核心線程數(shù),則將任務(wù)添加到阻塞隊(duì)列中,接著再次檢驗(yàn)線程池的運(yùn)行狀態(tài),因?yàn)樯洗螜z測(cè)過(guò)之后線程池狀態(tài)有可能發(fā)生了變化,如果線程池關(guān)閉了,那么移除任務(wù),執(zhí)行拒絕策略。如果線程依然是運(yùn)行狀態(tài),但是線程池中沒(méi)有線程,那么就調(diào)用addWorker方法創(chuàng)建線程,注意此時(shí)傳入任務(wù)參數(shù)是null,即不指定執(zhí)行任務(wù),因?yàn)槿蝿?wù)已經(jīng)加入了阻塞隊(duì)列。創(chuàng)建完線程后從阻塞隊(duì)列中取出任務(wù)執(zhí)行。
- 3.如果第2步將任務(wù)添加到阻塞隊(duì)列失敗了,說(shuō)明阻塞隊(duì)列任務(wù)已滿,那么則會(huì)執(zhí)行第三步,即創(chuàng)建非核心線程來(lái)執(zhí)行任務(wù),如果非核心線程創(chuàng)建失敗那么就執(zhí)行拒絕策略。
可以看到,代碼的執(zhí)行邏輯和我們?cè)诘诙轮蟹治龅木€程池的工作流程是一樣的。
接下來(lái)看下execute方法中創(chuàng)建線程的方法addWoker,addWoker方法承擔(dān)了核心線程和非核心線程的創(chuàng)建,通過(guò)一個(gè)boolean參數(shù)core來(lái)區(qū)分是創(chuàng)建核心線程還是非核心線程。先來(lái)看addWorker方法前半部分的代碼:
- // 返回值表示是否成功創(chuàng)建了線程
- private boolean addWorker(Runnable firstTask, boolean core) {
- // 這里做了一個(gè)retry標(biāo)記,相當(dāng)于goto.
- retry:
- for (int c = ctl.get();;) {
- // Check if queue empty only if necessary.
- if (runStateAtLeast(c, SHUTDOWN)
- && (runStateAtLeast(c, STOP)
- || firstTask != null
- || workQueue.isEmpty()))
- return false;
- for (;;) {
- // 根據(jù)core來(lái)確定創(chuàng)建最大線程數(shù),超過(guò)最大值則創(chuàng)建線程失敗,注意這里的最大值可能有s三個(gè)corePoolSize、maximumPoolSize和線程池線程的最大容量
- if (workerCountOf(c)
- >= ((core ? corePoolSize : maximumPoolSize) & COUNT_MASK))
- return false;
- // 通過(guò)CAS來(lái)將線程數(shù)+1,如果成功則跳出循環(huán),執(zhí)行下邊邏輯
- if (compareAndIncrementWorkerCount(c))
- break retry;
- c = ctl.get(); // Re-read ctl
- // 線程池的狀態(tài)發(fā)生了改變,退回retry重新執(zhí)行
- if (runStateAtLeast(c, SHUTDOWN))
- continue retry;
- }
- }
- // ...省略后半部分
- return workerStarted;
- }
這部分代碼會(huì)通過(guò)是否創(chuàng)建核心線程來(lái)確定線程池中線程數(shù)的值,如果是創(chuàng)建核心線程,那么最大值不能超過(guò)corePoolSize,如果是創(chuàng)建非核心線程那么線程數(shù)不能超過(guò)maximumPoolSize,另外無(wú)論是創(chuàng)建核心線程還是非核心線程,最大線程數(shù)都不能超過(guò)線程池允許的最大線程數(shù)COUNT_MASK(有可能設(shè)置的maximumPoolSize大于COUNT_MASK)。如果線程數(shù)大于最大值就返回false,創(chuàng)建線程失敗。
接下來(lái)通過(guò)CAS將線程數(shù)加1,如果成功那么就break retry結(jié)束無(wú)限循環(huán),如果CAS失敗了則就continue retry從新開(kāi)始for循環(huán),注意這里的retry不是Java的關(guān)鍵字,是一個(gè)可以任意命名的字符。
接下來(lái),如果能繼續(xù)向下執(zhí)行則開(kāi)始執(zhí)行創(chuàng)建線程并執(zhí)行任務(wù)的工作了,看下addWorker方法的后半部分代碼:
- private boolean addWorker(Runnable firstTask, boolean core) {
- // ...省略前半部分
- boolean workerStarted = false;
- boolean workerAdded = false;
- Worker w = null;
- try {
- // 實(shí)例化一個(gè)Worker,內(nèi)部封裝了線程
- w = new Worker(firstTask);
- // 取出新建的線程
- final Thread t = w.thread;
- if (t != null) {
- // 這里使用ReentrantLock加鎖保證線程安全
- final ReentrantLock mainLock = this.mainLock;
- mainLock.lock();
- try {
- int c = ctl.get();
- // 拿到鎖湖重新檢查線程池狀態(tài),只有處于RUNNING狀態(tài)或者處于SHUTDOWN并且firstTask==null時(shí)候才會(huì)創(chuàng)建線程
- if (isRunning(c) ||
- (runStateLessThan(c, STOP) && firstTask == null)) {
- // 線程不是處于NEW狀態(tài),說(shuō)明線程已經(jīng)啟動(dòng),拋出異常
- if (t.getState() != Thread.State.NEW)
- throw new IllegalThreadStateException();
- // 將線程加入線程隊(duì)列,這里的worker是一個(gè)HashSet
- workers.add(w);
- workerAdded = true;
- int s = workers.size();
- if (s > largestPoolSize)
- largestPoolSize = s;
- }
- } finally {
- mainLock.unlock();
- }
- if (workerAdded) {
- // 開(kāi)啟線程執(zhí)行任務(wù)
- t.start();
- workerStarted = true;
- }
- }
- } finally {
- if (! workerStarted)
- addWorkerFailed(w);
- }
- return workerStarted;
- }
這部分邏輯其實(shí)比較容易理解,就是創(chuàng)建Worker并開(kāi)啟線程執(zhí)行任務(wù)的過(guò)程,Worker是對(duì)線程的封裝,創(chuàng)建的worker會(huì)被添加到ThreadPoolExecutor中的HashSet中。也就是線程池中的線程都維護(hù)在這個(gè)名為workers的HashSet中并被ThreadPoolExecutor所管理,HashSet中的線程可能處于正在工作的狀態(tài),也可能處于空閑狀態(tài),一旦達(dá)到指定的空閑時(shí)間,則會(huì)根據(jù)條件進(jìn)行回收線程。
我們知道,線程調(diào)用start后就會(huì)開(kāi)始執(zhí)行線程的邏輯代碼,執(zhí)行完后線程的生命周期就結(jié)束了,那么線程池是如何保證Worker執(zhí)行完任務(wù)后仍然不結(jié)束的呢?當(dāng)線程空閑超時(shí)或者關(guān)閉線程池又是怎樣進(jìn)行線程回收的呢?這個(gè)實(shí)現(xiàn)邏輯其實(shí)就在Worker中。看下Worker的代碼:
- private final class Worker
- extends AbstractQueuedSynchronizer
- implements Runnable
- {
- // 執(zhí)行任務(wù)的線程
- final Thread thread;
- // 初始化Worker時(shí)傳進(jìn)來(lái)的任務(wù),可能為null,如果不空,則創(chuàng)建和立即執(zhí)行這個(gè)task,對(duì)應(yīng)核心線程創(chuàng)建的情況
- Runnable firstTask;
- Worker(Runnable firstTask) {
- // 初始化時(shí)設(shè)置setate為-1
- setState(-1); // inhibit interrupts until runWorker
- this.firstTask = firstTask;
- // 通過(guò)線程工程創(chuàng)建線程
- this.thread = getThreadFactory().newThread(this);
- }
- // 線程的真正執(zhí)行邏輯
- public void run() {
- runWorker(this);
- }
- // 判斷線程是否是獨(dú)占狀態(tài),如果不是意味著線程處于空閑狀態(tài)
- protected boolean isHeldExclusively() {
- return getState() != 0;
- }
- // 獲取鎖
- protected boolean tryAcquire(int unused) {
- if (compareAndSetState(0, 1)) {
- setExclusiveOwnerThread(Thread.currentThread());
- return true;
- }
- return false;
- }
- // 釋放鎖
- protected boolean tryRelease(int unused) {
- setExclusiveOwnerThread(null);
- setState(0);
- return true;
- }
- // ...
- }
Worker是位于ThreadPoolExecutor中的一個(gè)內(nèi)部類,它繼承了AQS,使用AQS來(lái)實(shí)現(xiàn)了獨(dú)占鎖的功能,但是并沒(méi)支持可重入。這里使用不可重入的特性來(lái)表示線程的執(zhí)行狀態(tài),即可以通過(guò)isHeldExclusively方法來(lái)判斷,如果是獨(dú)占狀態(tài),說(shuō)明線程正在執(zhí)行任務(wù),如果非獨(dú)占狀態(tài),說(shuō)明線程處于空閑狀態(tài)。關(guān)于AQS我們前邊文章中已經(jīng)詳細(xì)分析過(guò)了,不了解AQS的可以翻看前邊ReentrantLock的文章。
另外,Worker還實(shí)現(xiàn)了Runnable接口,因此它的執(zhí)行邏輯就是在run方法中,run方法調(diào)用的是線程池中的runWorker(this)方法。任務(wù)的執(zhí)行邏輯就在runWorker方法中,它的代碼如下:
- final void runWorker(Worker w) {
- Thread wt = Thread.currentThread();
- // 取出Worker中的任務(wù),可能為空
- Runnable task = w.firstTask;
- w.firstTask = null;
- w.unlock(); // allow interrupts
- boolean completedAbruptly = true;
- try {
- // task不為null或者阻塞隊(duì)列中有任務(wù),通過(guò)循環(huán)不斷的從阻塞隊(duì)列中取出任務(wù)執(zhí)行
- while (task != null || (task = getTask()) != null) {
- w.lock();
- // ...
- try {
- // 任務(wù)執(zhí)行前的hook點(diǎn)
- beforeExecute(wt, task);
- try {
- // 執(zhí)行任務(wù)
- task.run();
- // 任務(wù)執(zhí)行后的hook點(diǎn)
- afterExecute(task, null);
- } catch (Throwable ex) {
- afterExecute(task, ex);
- throw ex;
- }
- } finally {
- task = null;
- w.completedTasks++;
- w.unlock();
- }
- }
- completedAbruptly = false;
- } finally {
- // 超時(shí)沒(méi)有取到任務(wù),則回收空閑超時(shí)的線程
- processWorkerExit(w, completedAbruptly);
- }
- }
可以看到,runWorker的核心邏輯就是不斷通過(guò)getTask方法從阻塞隊(duì)列中獲取任務(wù)并執(zhí)行.通過(guò)這樣的方式實(shí)現(xiàn)了線程的復(fù)用,避免了創(chuàng)建線程。這里要注意的是這里是一個(gè)“生產(chǎn)者-消費(fèi)者”模式,getTask是從阻塞隊(duì)列中取任務(wù),所以如果阻塞隊(duì)列中沒(méi)有任務(wù)的時(shí)候就會(huì)處于阻塞狀態(tài)。
getTask中通過(guò)判斷是否要回收線程而設(shè)置了等待超時(shí)時(shí)間,如果阻塞隊(duì)列中一直沒(méi)有任務(wù),那么在等待keepAliveTime時(shí)間后會(huì)拋出異常。最終會(huì)走到上述代碼的finally方法中,意味著有線程空閑時(shí)間超過(guò)了keepAliveTime時(shí)間,那么調(diào)用processWorkerExit方法移除Worker。processWorkerExit方法中沒(méi)有復(fù)雜難以理解的邏輯,這里就不再貼代碼了。我們重點(diǎn)看下getTask中是如何處理的,代碼如下:
- private Runnable getTask() {
- boolean timedOut = false; // Did the last poll() time out?
- for (;;) {
- int c = ctl.get();
- // ...
- // Flag1. 如果配置了allowCoreThreadTimeOut==true或者線程池中的線程數(shù)大于核心線程數(shù),則timed為true,表示開(kāi)啟指定線程超時(shí)后被回收
- boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
- // ...
- try {
- // Flag2. 取出阻塞隊(duì)列中的任務(wù),注意如果timed為true,則會(huì)調(diào)用阻塞隊(duì)列的poll方法,并設(shè)置超時(shí)時(shí)間為keepAliveTime,如果超時(shí)沒(méi)有取到任務(wù)則會(huì)拋出異常。
- Runnable r = timed ?
- workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
- workQueue.take();
- if (r != null)
- return r;
- timedOut = true;
- } catch (InterruptedException retry) {
- timedOut = false;
- }
- }
- }
重點(diǎn)看getTask是如何處理空閑超時(shí)的邏輯的。我們知道,回收線程的條件是線程大于核心線程數(shù)或者配置了allowCoreThreadTimeOut為true,當(dāng)線程空閑超時(shí)的情況下就會(huì)回收線程。上述代碼在Flag1處先判斷了如果線程池中的線程數(shù)大于核心線程數(shù),或者開(kāi)啟了allowCoreThreadTimeOut,那么就需要開(kāi)啟線程空閑超時(shí)回收。
所有在Flag2處,timed為true的情況下調(diào)用了阻塞隊(duì)列的poll方法,并傳入了超時(shí)時(shí)間為keepAliveTime,如果在keepAliveTime時(shí)間內(nèi),阻塞隊(duì)列一直為null那么久會(huì)拋出異常,結(jié)束runWorker的循環(huán)。進(jìn)而執(zhí)行runWorker方法中回收線程的操作。
這里需要我們理解阻塞隊(duì)列poll方法的使用,poll方法接受一個(gè)時(shí)間參數(shù),是一個(gè)阻塞操作,在給定的時(shí)間內(nèi)沒(méi)有獲取到數(shù)據(jù)就會(huì)拋出異常。其實(shí)說(shuō)白了,阻塞隊(duì)列就是一個(gè)使用ReentrantLock實(shí)現(xiàn)的“生產(chǎn)者-消費(fèi)者”模式,我們?cè)谏钊肜斫釰ava線程的等待與喚醒機(jī)制(二)這篇文章中使用ReentrantLock實(shí)現(xiàn)“生產(chǎn)者-消費(fèi)者”模型其實(shí)就是一個(gè)簡(jiǎn)單的阻塞隊(duì)列,與JDK中的BlockingQueue實(shí)現(xiàn)機(jī)制類似。感興趣的同學(xué)可以自己查看ArrayBlockingQueue等阻塞隊(duì)列的實(shí)現(xiàn),限于文章篇幅,這里就不再贅述了。
ThreadPoolExecutor的拒絕策略
上一小節(jié)中我們多次提到線程池的拒絕策略,它是在reject方法中實(shí)現(xiàn)的。實(shí)現(xiàn)代碼也非常簡(jiǎn)單,代碼如下:
- final void reject(Runnable command) {
- handler.rejectedExecution(command, this);
- }
通過(guò)調(diào)用handler的rejectedExecution方法實(shí)現(xiàn)。這里其實(shí)就是運(yùn)用了策略模式,handler是一個(gè)RejectedExecutionHandler類型的成員變量,RejectedExecutionHandler是一個(gè)接口,只有一個(gè)rejectedExecution方法。在實(shí)例化線程池時(shí)構(gòu)造方法中傳入對(duì)應(yīng)的拒絕策略實(shí)例即可。前文已經(jīng)提到了Java提供的幾種默認(rèn)實(shí)現(xiàn)分別為DiscardPolicy、DiscardOldestPolicy、CallerRunsPolicy以及AbortPolicy。
以AbortPolicy直接拋出異常為例,來(lái)看下代碼實(shí)現(xiàn):
- public static class AbortPolicy implements RejectedExecutionHandler {
- public AbortPolicy() { }
- public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
- throw new RejectedExecutionException("Task " + r.toString() +
- " rejected from " +
- e.toString());
- }
可以看到直接在rejectedExecution方法中拋出了RejectedExecutionException來(lái)拒絕任務(wù)。其他的幾個(gè)策略實(shí)現(xiàn)也都比較簡(jiǎn)單,有興趣可以自己查閱代碼。
ThreadPoolExecutor的shutdown
調(diào)用shutdown方法后,會(huì)將線程池標(biāo)記為SHUTDOWN狀態(tài),上邊execute的源碼可以看出,只有線程池是RUNNING狀態(tài)才接受任務(wù),因此被標(biāo)記位SHUTDOWN后,再提交任務(wù)會(huì)被線程池拒絕。shutdown的代碼如下:
- public void shutdown() {
- final ReentrantLock mainLock = this.mainLock;
- mainLock.lock();
- try {
- //檢查是否可以關(guān)閉線程
- checkShutdownAccess();
- // 將線程池狀態(tài)置為SHUTDOWN狀態(tài)
- advanceRunState(SHUTDOWN);
- // 嘗試中斷空閑線程
- interruptIdleWorkers();
- // 空方法,線程池關(guān)閉的hook點(diǎn)
- onShutdown();
- } finally {
- mainLock.unlock();
- }
- tryTerminate();
- }
- private void interruptIdleWorkers() {
- interruptIdleWorkers(false);
- }
修改線程池為SHUTDOWN狀態(tài)后,會(huì)調(diào)用interruptIdleWorkers去中斷空閑線程線程,具體實(shí)現(xiàn)邏輯是在interruptIdleWorkers(boolean onlyOne)方法中,如下:
- private void interruptIdleWorkers(boolean onlyOne) {
- final ReentrantLock mainLock = this.mainLock;
- mainLock.lock();
- try {
- for (Worker w : workers) {
- Thread t = w.thread;
- // 嘗試tryLock獲取鎖,如果拿鎖成功說(shuō)明線程是空閑狀態(tài)
- if (!t.isInterrupted() && w.tryLock()) {
- try {
- // 中斷線程
- t.interrupt();
- } catch (SecurityException ignore) {
- } finally {
- w.unlock();
- }
- }
- if (onlyOne)
- break;
- }
- } finally {
- mainLock.unlock();
- }
- }
shutdown的邏輯比較簡(jiǎn)單,里邊做了兩件比較重要的事情,即先將線程池狀態(tài)修改為SHUTDOWN,接著遍歷所有Worker,將空閑的Worker進(jìn)行中斷。
總結(jié)
本文深入的探究了線程池的工作流程和實(shí)現(xiàn)原理。就線程池的工作流程而言其實(shí)并不難以理解。但是在分析線程池的源碼時(shí),如果沒(méi)有很好的并發(fā)基礎(chǔ)的話,大概率是難以讀懂線程池的源碼的。因?yàn)榫€程池內(nèi)部使用了大量并發(fā)知識(shí),對(duì)任何一點(diǎn)用到的并發(fā)知識(shí)認(rèn)識(shí)不到位都會(huì)造成理解偏差。寫(xiě)這篇文章參看了很多的其他線程池的相關(guān)文章,幾乎沒(méi)有找到一篇能夠剖析清楚線程池源碼的文章。歸根結(jié)底還是沒(méi)能系統(tǒng)的理解Atomic、Lock與AQS、CAS、阻塞隊(duì)列等并發(fā)相關(guān)知識(shí)。