為什么固態(tài)會掉盤?著名的30分鐘大法修復(fù)是什么原理?
如果現(xiàn)代的臺式機(jī)或者筆記本忽然斷電(Power Loss),你覺得哪個(gè)硬件部分容易損壞?出乎大多數(shù)人的意料的是,固態(tài)硬盤SSD最脆弱,容易出現(xiàn)掉盤的現(xiàn)象,也就是BIOS和操作系統(tǒng)不認(rèn)盤的情況。今天我們就一起來Deep Dive一下原理和應(yīng)對之道,并對有趣的“30分鐘大法”的原理和是否正確進(jìn)行一些分析。
FTL損壞和丟失
我介紹了很多SSD的原理,其中最重要的根本是對FTL的理解。SSD甚至SD卡、手機(jī)存貯的很多問題和解決方案都或多或少地和它相關(guān),再怎么強(qiáng)調(diào)都不為過。為了理解后面的原理,我們先來簡單回顧一下FTL:我們的寫(Program)Flash操作只能把bit 1改成0,而不能從0改成1. 即我們可以把11110000改成11000000,但不能改成11111111。即有點(diǎn)像邏輯and操作(我們可以通過NAND這個(gè)名字聯(lián)想記憶一下)。那么如何把0改回1呢?這就要靠擦除操作了,但是別忘了,NAND flash的壽命是由其擦寫次數(shù)決定的(P/E數(shù) (Program/Erase Count)來衡量的),頻繁的擦除慢慢的會產(chǎn)生壞塊,如FAT分區(qū)的文件分配表(老狼:FAT文件系統(tǒng)與UEFI)等。為了能夠做到壽命均衡(Wear Levelling)和對壞塊的遮蔽,就需要一個(gè)邏輯地址(LBA,logical block addresses )和物理地址(PBA, physical block addresses)的對應(yīng)表,對外界暴露邏輯塊,里面是具體是哪個(gè)物理塊,固件自己做主,這個(gè)對應(yīng)關(guān)系表就是FTL表:

因?yàn)長BA大部分實(shí)現(xiàn)是基于Page的,也叫做Page Mapping Table (PMT):

FTL看起來挺簡單,但它是SSD、NAND等基礎(chǔ)邏輯,它的實(shí)現(xiàn)多種多樣,是各個(gè)固件的核心機(jī)密。也有些Open Source的方案。
FTL表在哪里呢?作為核心數(shù)據(jù)結(jié)構(gòu),它當(dāng)然也要存儲在Flash上。但由于它會被頻繁更新,所以每次改動也不能立刻寫會Flash,一般會先暫存在內(nèi)存中,在積累到一定程度,再寫回Flash:

什么時(shí)間寫回,這是SSD固件的核心機(jī)密之一。另一方面,隨著SSD容量的提高,F(xiàn)TL表的容量也快速上漲。我們以8GB的為例,F(xiàn)TL表不加處理可以達(dá)到8MB;以此類推,800G的SSD,F(xiàn)TL表可以有800MB!有些省空間的方案可以大大減小FTL表的大小,但也高達(dá)數(shù)十MB。這么大,F(xiàn)TL表也就有了部分被換入換出的過程。如何設(shè)計(jì),也是很講究技巧的。
FTL表如此重要,沒了它,整個(gè)SSD/SD卡就沒法工作了。如果在FTL寫回Flash之前,還在內(nèi)存的時(shí)候,忽然沒電了,內(nèi)存數(shù)據(jù)丟失,F(xiàn)TL表也就丟失了。有鑒于此,高端SSD和服務(wù)器SSD都加上了電容,來作為應(yīng)急供電方案,讓SSD控制器有時(shí)間把內(nèi)存中的FTL表和一些緩存內(nèi)容存到Flash上去:

現(xiàn)實(shí)中的例子,我們在M.2的SSD上面有很多很小的電容:

在Vcc沒電的時(shí)候,這些電容的gate就會打開,會為主控爭取1ms左右的時(shí)間。主控會立刻放棄現(xiàn)在所有沒有存儲的數(shù)據(jù),而立刻開始存儲FTL表,保證不會出大問題。
在企業(yè)級的SSD中,有的DRAM大小將近1GB,而企業(yè)SSD的數(shù)據(jù)完整性要求極高,不容有失,不但FTL表要存好,DRAM中沒有存儲過的,也必須全部存下來。這就需要很大的電容,來爭取更多的時(shí)間,如果我們拆開企業(yè)SSD,就會發(fā)現(xiàn)很多大黃快:

它們也是為了這個(gè)目的。
但是,一些低端消費(fèi)級的SSD,沒有這種措施,忽然掉電,會造成FTL丟失。那么發(fā)生這種情況是不是SSD就報(bào)廢了呢?也不是。
FTL表的重建
在內(nèi)存中FTL丟失之前,F(xiàn)lash上還有上次的FTL內(nèi)容,雖然已經(jīng)過時(shí)了,但總比沒有好吧!于是可以搜索SSD中的Flash,找到上次的FTL,這樣盡管會丟失一些信息,但大部分?jǐn)?shù)據(jù)可以保持。于此同時(shí),有些實(shí)際塊已經(jīng)被分配使用過了,再次用會發(fā)生錯(cuò)誤,就需要修正最后的FTL。那么怎么修正呢?
每個(gè)Flash的page都有一些額外的空間,這些空間大部分做ECC校驗(yàn)用,但還有些富余,我們拿來做Mapping Flag(MF):

有了這個(gè)提示,我們可以逐Page掃描整個(gè)Flash,來修正FTL。
看到逐Page,就知道這是個(gè)很耗時(shí)的工作。現(xiàn)在SSD那么大,需要不少時(shí)間,可以高達(dá)數(shù)分鐘乃至數(shù)十分鐘!
那么什么時(shí)間做FTL的重建呢?不少主控都在發(fā)現(xiàn)錯(cuò)誤后會開始重建,直到成功重建,主控才會響應(yīng)ATA等命令。這就是為什么忽然斷點(diǎn)后,有些SSD會很長時(shí)間沒有響應(yīng),想掉盤一樣了!那么為什么有時(shí)候斷電后又沒問題呢?如果當(dāng)時(shí)新的FTL已經(jīng)被寫回Flash中去,沒有錯(cuò)誤,當(dāng)然也就不會出問題了。
30分鐘大法是怎么回事?
掉電后各個(gè)主控的表現(xiàn)不一,這和它們的FTL存儲算法有關(guān)。某些主控可以迅速恢復(fù),有些則可能耗時(shí)很久,為了給某些主控充足的時(shí)間重建FTL表,掉盤后可以這樣做:
1.掉電開機(jī)后,發(fā)現(xiàn)掉盤。如果是系統(tǒng)盤,則啟動失敗,如果是數(shù)據(jù)盤,則在操作系統(tǒng)里面發(fā)現(xiàn)該盤沒有了。
2.不要立即重啟,啥也不干,等待30分鐘,讓SSD主控充分的時(shí)間自行修復(fù)FTL。
3. 30分鐘后,關(guān)機(jī)。再開機(jī),看能不能找到該SSD。
有些同學(xué)還有些額外的步驟,即不插數(shù)據(jù)線,光插電源線開機(jī)30分鐘。盡管我現(xiàn)在已經(jīng)不做Flash相關(guān)工作,但我從經(jīng)驗(yàn)和原理上認(rèn)為這個(gè)步驟不是必須的。另外M.2的SSD也可照此辦理。
需要特別提醒的是,比較忌諱在此過程中十分煩躁,不停關(guān)機(jī)開機(jī)和重啟,打斷主控重建FTL的過程,有可能加劇錯(cuò)誤造成徹底不可以用了。
結(jié)論
斷電會造成FTL表損壞,進(jìn)而可能出現(xiàn)掉盤的現(xiàn)象。正確利用30分鐘大法,可以修正部分問題,關(guān)鍵是給主控充分的時(shí)間進(jìn)行FTL表的重建。其實(shí)不光斷電,高溫也有可能造成掉盤。我在我的筆記本M.2上插了塊500GB某廠SSD,在大量拷貝電影時(shí),過熱會讓該SSD主控忽然停止工作。我的筆記本這時(shí)就會沒有響應(yīng),在過了一會后,要不藍(lán)屏,要不就是發(fā)現(xiàn)該盤符沒有了。這是我如果直接重啟,就會發(fā)現(xiàn)在BIOS里面和Windows中,該硬盤都沒有了。我這時(shí)就會讓筆記本涼一會,再重啟,硬盤就又出現(xiàn)了。這也是30分鐘大法的一個(gè)變種。
如果還不能修復(fù),其實(shí)還可以進(jìn)入工程模式進(jìn)行恢復(fù)。但是該過程比較復(fù)雜,軟件昂貴,還是留給專業(yè)人士吧!