作者 | 蔡柱梁
審校 | 重樓
一、前言
很多 Java 開發(fā)一般都是做中臺較多,并發(fā)編程使用的不多。因此,對 ThreadLocal 不太熟悉,所以筆者這里想讓大家了解它,知道它是用來干什么的。
二、ThreadLocal 是用來干什么的
ThreadLocal 是 Java 中一種線程封閉技術(shù),它提供了一種線程本地變量的機(jī)制,使得每個線程都擁有一個獨立的變量副本,這樣可以避免多個線程訪問同一個變量時產(chǎn)生的并發(fā)問題。
ThreadLocal 在工作中還是蠻常用的,筆者使用到的一些場景如下:
- 使用 zk 實現(xiàn)選舉,采用單例 zkClient,但是對于里面一些全局變量就會存在線程安全問題,這時會希望這些特定的全局變量可以跟線程綁定。
- 項目UUC(統(tǒng)一認(rèn)證中心),不同的用戶登錄,系統(tǒng)是如何確保當(dāng)前用戶的信息不會被張冠李戴的呢?其實都是通過 ThreadLocal 實現(xiàn)的(不過在 UUC 中,筆者使用的是 InheritableThreadLocal,這個會有點區(qū)別)。
- 參數(shù)傳遞,比如流水生成的方法里面的重試機(jī)制,假設(shè)限制重試 5 次,生成流水號的方法內(nèi)部很多地方都可能失敗需要重試(并發(fā)沖突或者 db 異常),最傳統(tǒng)的方式就是將重試的次數(shù)傳遞。這種方式不夠優(yōu)雅,我們可以使用 ThreadLocal 來實現(xiàn)傳遞。
總的來說,當(dāng)你需要和線程綁定的變量時,就可以考慮使用 ThreadLocal 啦!
至于線程安全問題,大家不妨想想我們平常說線程安全問題都是出現(xiàn)在什么場景?同一時間有兩個或兩個以上的線程對同一個變量進(jìn)行修改,才有可能出現(xiàn)線程安全問題。但是使用 ThreadLocal,每個線程是獨享自己的變量副本的,哪里還有線程安全問題呢?
三、ThreadLocal 如何使用
這個上網(wǎng)一搜一大堆,筆者就說下注意事項好了,用完后一定要釋放,避免內(nèi)存泄漏,提供幾個點給大家參考:
- 及時清理
- 確保在線程結(jié)束時,及時清理 ThreadLocal 中存儲的數(shù)據(jù)??梢酝ㄟ^在使用完 ThreadLocal 后調(diào)用 remove() 方法來清理對應(yīng)的數(shù)據(jù)。例如,可以使用 ThreadLocal.remove() 或在 finally 塊中進(jìn)行清理操作。
- 使用弱引用(WeakReference)
- 可以使用 ThreadLocal 的變體,如 InheritableThreadLocal 或 WeakThreadLocal,它們使用了弱引用來存儲數(shù)據(jù)。這樣,在沒有其他強(qiáng)引用指向被存儲的對象時,垃圾回收器可以自動清理該對象,避免內(nèi)存泄漏。
- 避免長時間存儲大量數(shù)據(jù)
- 盡量避免在 ThreadLocal 中存儲大量數(shù)據(jù),特別是對于長時間運(yùn)行的線程。因為 ThreadLocal 的值在線程的整個生命周期中都存在,如果存儲大量數(shù)據(jù),可能會導(dǎo)致內(nèi)存占用過高。
- 及時釋放資源
- 如果你在 ThreadLocal 中存儲了需要手動釋放的資源,確保在不再需要時及時釋放資源??梢酝ㄟ^在使用完資源后顯式地調(diào)用資源的釋放方法或使用 try-with-resources 語句來實現(xiàn)。
- 防止線程池中的內(nèi)存泄漏
- 當(dāng)使用線程池時,要特別小心使用 ThreadLocal。確保在任務(wù)完成后清理 ThreadLocal 中的數(shù)據(jù),以避免線程重用時的數(shù)據(jù)干擾和潛在的內(nèi)存泄漏問題??梢栽谌蝿?wù)的開始和結(jié)束處使用 ThreadLocal 進(jìn)行數(shù)據(jù)綁定和解綁。
總之,要正確使用 ThreadLocal 并避免內(nèi)存泄漏問題,需要注意適時清理、使用弱引用、避免存儲過多數(shù)據(jù)、及時釋放資源,并在使用線程池時特別小心。
四、ThreadLocal 的實現(xiàn)原理
下面是一個簡單的示例代碼:
public class ThreadLocalExample {
private static final ThreadLocal<Object> threadLocal = new ThreadLocal<>();
public static void main(String[] args) {
Thread workerThread = new Thread(() -> {
try {
// 在線程中設(shè)置ThreadLocal值
threadLocal.set(new Object());
// 執(zhí)行業(yè)務(wù)邏輯
// ...
} finally {
// 在線程結(jié)束時清理ThreadLocal值
threadLocal.remove();
}
});
workerThread.start();
// 等待線程結(jié)束
try {
workerThread.join();
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
在示例代碼中,線程 workerThread 和 ThreadLocal 實例是一個怎樣的關(guān)系呢?set 方法和 remove 方法都做了什么呢?為什么會有內(nèi)存泄漏的情況呢?我們帶著疑問一起往下看。
4.1 java.lang.ThreadLocal#set
我們直接從源碼開始分析 ThreadLocal。
public void set(T value) {
// 獲取當(dāng)前線程
Thread t = Thread.currentThread();
// 通過當(dāng)前線程獲取ThreadLocalMap
ThreadLocalMap map = getMap(t);
if (map != null)
map.set(this, value);
else
createMap(t, value);
}
ThreadLocalMap getMap(Thread t) {
return t.threadLocals;
}
void createMap(Thread t, T firstValue) {
t.threadLocals = new ThreadLocalMap(this, firstValue);
}
ThreadLocalMap(ThreadLocal<?> firstKey, Object firstValue) {
table = new Entry[INITIAL_CAPACITY];
int i = firstKey.threadLocalHashCode & (INITIAL_CAPACITY - 1);
table[i] = new Entry(firstKey, firstValue);
size = 1;
setThreshold(INITIAL_CAPACITY);
}
static class Entry extends WeakReference<ThreadLocal<?>> {
/** The value associated with this ThreadLocal. */
Object value;
Entry(ThreadLocal<?> k, Object v) {
super(k);
value = v;
}
}
結(jié)合示例代碼來看,這里是當(dāng)前線程A在 main 方法中通過 threadLocal 實例調(diào)用 threadLocal.set 方法,而 set 方法會給當(dāng)前線程創(chuàng)建一個 ThreadLocalMap(如果沒有的話),并使用 threadLocal 實例作為 key。
它們的關(guān)系如下圖:
4.2 內(nèi)存泄漏問題
這里應(yīng)該分成兩種情況看:無線程復(fù)用和有線程復(fù)用。
- 無線程復(fù)用
當(dāng) workerThread 結(jié)束后,沒有強(qiáng)引用的 ThreadLocalMap 自然而然也會被垃圾回收器回收,不會出現(xiàn)內(nèi)存泄漏。 - 有線程復(fù)用
這里也要分開看,有釋放和無釋放的情況。如果發(fā)生內(nèi)存泄漏,當(dāng)然就是我們沒有釋放導(dǎo)致的(釋放可以通過調(diào)用 set、get、remove方法釋放)。當(dāng)我們使用線程池,線程會被復(fù)用時,ThreadLocalMap 的生命周期與它綁定的線程是一樣的,所以不會被回收。如果這時發(fā)生了 gc,那么 Entry 的 key 是弱引用,key 會變成 null,而 value 將繼續(xù)存活。如果該線程一直不調(diào)用 set/get/remove 方法,那么 value 一直得不到釋放,就會發(fā)生內(nèi)存泄漏的現(xiàn)象。
那為什么使用 set/get/remove 可以避免內(nèi)存泄漏呢?因為 set/get 在根據(jù)當(dāng)前線程找到對應(yīng) Entry 元素后(這里是剛好是碰到了 key==null 的 entry[i],碰不到是不會順手釋放舊 value 的。因此,最好還是使用完后調(diào)用 remove 釋放),發(fā)現(xiàn) key == null,就會調(diào)用java.lang.ThreadLocal.ThreadLocalMap#expungeStaleEntry 釋放引用,所以就不會發(fā)生內(nèi)存泄漏了。這里就不再展示源碼了,有興趣的可以自己去看下。
五、哈希沖突問題
上面看到 ThreadLocalMap 使用了 Hash,是不是馬上就想到了哈希沖突呢?HashMap 遇到哈希沖突,在 key 不相同的情況下,會使用鏈表解決。但是 ThreadLocalMap 的 Entry 沒有 next 指針,因此它明顯不會采用鏈表,那么它是如何解決哈希沖突的呢?
請看 java.lang.ThreadLocal.ThreadLocalMap#set 源碼,筆者添加了注釋,可以看到是怎么解決哈希沖突的。
private void set(ThreadLocal<?> key, Object value) {
// We don't use a fast path as with get() because it is at
// least as common to use set() to create new entries as
// it is to replace existing ones, in which case, a fast
// path would fail more often than not.
Entry[] tab = table;
int len = tab.length;
int i = key.threadLocalHashCode & (len-1);
for (Entry e = tab[i];
e != null;
// 存在哈希沖突的話,會往下走,如果超過數(shù)組長度,就會回到0
e = tab[i = nextIndex(i, len)]) {
ThreadLocal<?> k = e.get();
if (k == key) {
// 找到存儲自己的entry,更新value
e.value = value;
return;
}
if (k == null) {
// 因為 gc 導(dǎo)致 key 被回收了,這個 Entry 會被新的 Entry 取代(新的Entry的key和value就是這里的傳參),舊的會被釋放
replaceStaleEntry(key, value, i);
return;
}
}
tab[i] = new Entry(key, value);
int sz = ++size;
if (!cleanSomeSlots(i, sz) && sz >= threshold)
rehash();
}
總結(jié)
到這里相信大家對 ThreadLocal 都有了一定的了解。有什么想交流可以留言或私信筆者。
作者介紹
蔡柱梁,51CTO社區(qū)編輯,從事Java后端開發(fā)8年,做過傳統(tǒng)項目廣電BOSS系統(tǒng),后投身互聯(lián)網(wǎng)電商,負(fù)責(zé)過訂單,TMS,中間件等。