面試官問我同步容器(如Vector)的所有操作一定是線程安全的嗎?我懵了!
為了方便編寫出線程安全的程序,Java里面提供了一些線程安全類和并發工具,比如:同步容器、并發容器、阻塞隊列等。
最常見的同步容器就是Vector和Hashtable了,那么,同步容器的所有操作都是線程安全的嗎?
這個問題不知道你有沒有想過,本文就來深入分析一下這個問題,一個很容易被忽略的問題。
1.同步容器
在Java中,同步容器主要包括2類:
- 1、Vector、Stack、HashTable
- 2、Collections類中提供的靜態工廠方法創建的類
本文拿相對簡單的Vecotr來舉例,我們先來看下Vector中幾個重要方法的源碼:
- public synchronized boolean add(E e) {
- modCount++;
- ensureCapacityHelper(elementCount + 1);
- elementData[elementCount++] = e;
- return true;
- }
- public synchronized E remove(int index) {
- modCount++;
- if (index >= elementCount)
- throw new ArrayIndexOutOfBoundsException(index);
- E oldValue = elementData(index);
- int numMoved = elementCount - index - 1;
- if (numMoved > 0)
- System.arraycopy(elementData, index+1, elementData, index,
- numMoved);
- elementData[--elementCount] = null; // Let gc do its work
- return oldValue;
- }
- public synchronized E get(int index) {
- if (index >= elementCount)
- throw new ArrayIndexOutOfBoundsException(index);
- return elementData(index);
- }
可以看到,Vector這樣的同步容器的所有公有方法全都是synchronized的,也就是說,我們可以在多線程場景中放心的使用單獨這些方法,因為這些方法本身的確是線程安全的。但是,請注意上面這句話中,有一個比較關鍵的詞:單獨因為,雖然同步容器的所有方法都加了鎖,但是對這些容器的復合操作無法保證其線程安全性。需要客戶端通過主動加鎖來保證。簡單舉一個例子,我們定義如下刪除Vector中最后一個元素方法:
- public Object deleteLast(Vector v){
- int lastIndex = v.size()-1;
- v.remove(lastIndex);
- }
上面這個方法是一個復合方法,包括size()和remove(),乍一看上去好像并沒有什么問題,無論是size()方法還是remove()方法都是線程安全的,那么整個deleteLast方法應該也是線程安全的。但是時,如果多線程調用該方法的過程中,remove方法有可能拋出ArrayIndexOutOfBoundsException。
- Exception in thread "Thread-1" java.lang.ArrayIndexOutOfBoundsException: Array index out of range: 879
- at java.util.Vector.remove(Vector.java:834)
- at com.hollis.Test.deleteLast(EncodeTest.java:40)
- at com.hollis.Test$2.run(EncodeTest.java:28)
- at java.lang.Thread.run(Thread.java:748)
我們上面貼了remove的源碼,我們可以分析得出:當index >= elementCount時,會拋出ArrayIndexOutOfBoundsException ,也就是說,當當前索引值不再有效的時候,將會拋出這個異常。因為removeLast方法,有可能被多個線程同時執行,當線程2通過index()獲得索引值為10,在嘗試通過remove()刪除該索引位置的元素之前,線程1把該索引位置的值刪除掉了,這時線程一在執行時便會拋出異常。
為了避免出現類似問題,可以嘗試加鎖:
- public void deleteLast() {
- synchronized (v) {
- int index = v.size() - 1;
- v.remove(index);
- }
- }
如上,我們在deleteLast中,對v進行加鎖,即可保證同一時刻,不會有其他線程刪除掉v中的元素。另外,如果以下代碼會被多線程執行時,也要特別注意:
- for (int i = 0; i < v.size(); i++) {
- v.remove(i);
- }
由于,不同線程在同一時間操作同一個Vector,其中包括刪除操作,那么就同樣有可能發生線程安全問題。所以,在使用同步容器的時候,如果涉及到多個線程同時執行刪除操作,就要考慮下是否需要加鎖。
2.同步容器的問題
前面說過了,同步容器直接保證單個操作的線程安全性,但是無法保證復合操作的線程安全,遇到這種情況時,必須要通過主動加鎖的方式來實現。而且,除此之外,同步容易由于對其所有方法都加了鎖,這就導致多個線程訪問同一個容器的時候,只能進行順序訪問,即使是不同的操作,也要排隊,如get和add要排隊執行。這就大大的降低了容器的并發能力。
3.并發容器
針對前文提到的同步容器存在的并發度低問題,從Java5開始,java.util.concurent包下,提供了大量支持高效并發的訪問的集合類,我們稱之為并發容器。
針對前文提到的同步容器的復合操作的問題,一般在Map中發生的比較多,所以在ConcurrentHashMap中增加了對常用復合操作的支持,比如putIfAbsent()、replace(),這2個操作都是原子操作,可以保證線程安全。另外,并發包中的CopyOnWriteArrayList和CopyOnWriteArraySet是Copy-On-Write的兩種實現。Copy-On-Write容器即寫時復制的容器。通俗的理解是當我們往一個容器添加元素的時候,不直接往當前容器添加,而是先將當前容器進行Copy,復制出一個新的容器,然后新的容器里添加元素,添加完元素之后,再將原容器的引用指向新的容器。CopyOnWriteArrayList中add/remove等寫方法是需要加鎖的,而讀方法是沒有加鎖的。這樣做的好處是我們可以對CopyOnWrite容器進行并發的讀,當然,這里讀到的數據可能不是最新的。因為寫時復制的思想是通過延時更新的策略來實現數據的最終一致性的,并非強一致性。但是,作為代替Vector的CopyOnWriteArrayList并沒有解決同步容器的復合操作的線程安全性問題。
4.總結
本文介紹了同步容器和并發容器。同步容器是通過加鎖實現線程安全的,并且只能保證單獨的操作是線程安全的,無法保證復合操作的線程安全性。并且同步容器的讀和寫操作之間會互相阻塞。并發容器是Java 5中提供的,主要用來代替同步容器。有更好的并發能力。而且其中的ConcurrentHashMap定義了線程安全的復合操作。在多線程場景中,如果使用并發容器,一定要注意復合操作的線程安全問題。必要時候要主動加鎖。在并發場景中,建議直接使用java.util.concurent包中提供的容器類,如果需要復合操作時,建議使用有些容器自身提供的復合方法。
【本文是51CTO專欄作者Hollis的原創文章,作者微信公眾號Hollis(ID:hollischuang)】