災(zāi)難恢復(fù)團(tuán)隊(duì)必須測試的五大 IT 災(zāi)難場景
IT 團(tuán)隊(duì)準(zhǔn)備應(yīng)對的典型中斷是常見事件,例如磁盤故障或斷電。但是,企業(yè)必須解決更多 IT 災(zāi)難場景才能得到充分保護(hù)。
許多 IT 災(zāi)難的根源通常是負(fù)責(zé)恢復(fù)的人員沒有考慮硬件故障或意外或惡意丟失數(shù)據(jù)以外的任何事情。遺憾的是,威脅和場景總是在不斷變化,因此災(zāi)難恢復(fù)計(jì)劃也必須這樣做。
有許多形式的災(zāi)難會影響 IT 服務(wù)的可用性,有些災(zāi)難可能比其他組織更與單個組織相關(guān)。評估哪些風(fēng)險(xiǎn)最有可能威脅到公司的基礎(chǔ)設(shè)施和服務(wù)是一個謹(jǐn)慎的舉動。風(fēng)險(xiǎn)評估矩陣是一種工具,可以幫助確定災(zāi)難發(fā)生的可能性及其嚴(yán)重程度。
以下是災(zāi)難恢復(fù)團(tuán)隊(duì)必須準(zhǔn)備的五種可能的 IT 災(zāi)難場景,以及有關(guān)如何做到這一點(diǎn)的提示,無論業(yè)務(wù)規(guī)模和類型、位置和基礎(chǔ)架構(gòu)如何。
失敗的備份
失敗的備份是最常見的 IT 災(zāi)難之一。企業(yè)可以更換硬件和軟件,但如果數(shù)據(jù)和所有備份都消失了,那么將它們恢復(fù)可能是不可能的,或者非常昂貴。
系統(tǒng)管理員必須定期測試他們從備份還原的能力,以確保備份正常工作,并且還原過程沒有一些看不見的致命缺陷。同時,應(yīng)始終存在多代備份,其中一些備份集在異地進(jìn)行。
自然災(zāi)害
自然災(zāi)害可以有多種形式,包括火災(zāi)、洪水和地震。雖然災(zāi)難的類型可能因地區(qū)而異,但幾乎所有災(zāi)難都可能損壞硬件并導(dǎo)致數(shù)據(jù)丟失。許多會使工作場所長時間無法進(jìn)入。
一些組織可能沒有意識到他們的辦公室位于洪泛平原或地震多發(fā)地區(qū),直到為時已晚。緩解此類問題需要一定程度的前瞻性規(guī)劃。
故障進(jìn)入云以保持核心服務(wù)工作的能力意味著,雖然并非每個應(yīng)用程序都可用,但那些對運(yùn)行業(yè)務(wù)至關(guān)重要的應(yīng)用程序是可用的。建設(shè)基礎(chǔ)設(shè)施,使遠(yuǎn)程工作成為一種可行的選擇,是為各種自然災(zāi)害做準(zhǔn)備的另一種方式。
能夠故障到云中并在異地工作需要一些深思熟慮、規(guī)劃和應(yīng)用,但如果發(fā)生災(zāi)難,會帶來巨大的回報(bào)。維修和更換建筑物和硬件所需的時間可能比人們估計(jì)的要長,而在恢復(fù)期間無法運(yùn)作的企業(yè)將面臨嚴(yán)重財(cái)務(wù)損失的風(fēng)險(xiǎn)。
災(zāi)難恢復(fù)團(tuán)隊(duì)可以使用風(fēng)險(xiǎn)評估矩陣來確定不同 IT 災(zāi)難場景的可能性和嚴(yán)重性。
勒索軟件攻擊
勒索軟件不僅是企業(yè)可能發(fā)生的最具破壞性的災(zāi)難之一,而且可能也是最有可能發(fā)生的災(zāi)難。只需要一個具有足夠權(quán)限的人點(diǎn)擊錯誤的鏈接就會造成混亂。
防御勒索軟件既不是微不足道的,也不是便宜的。許多現(xiàn)代勒索軟件都具有智能功能,可以確保在破壞幾代備份之前不會激活。
有許多方法可以降低勒索軟件攻擊的風(fēng)險(xiǎn),但沒有一種單一的預(yù)防工具。使應(yīng)用程序和操作系統(tǒng)補(bǔ)丁保持最新狀態(tài),掃描電子郵件以查找可疑附件,限制對外部媒體的訪問并提供良好的用戶教育將有所幫助。
網(wǎng)絡(luò)中斷
不幸的是,這種 IT 災(zāi)難場景經(jīng)常發(fā)生。例如,重型機(jī)械可能會切斷電纜,使網(wǎng)絡(luò)無法訪問。隨著越來越多的 IT 系統(tǒng)基于 SaaS,網(wǎng)絡(luò)中斷是一個越來越緊迫的問題。網(wǎng)絡(luò)連接對于加入和使用 SaaS 系統(tǒng)至關(guān)重要。
幸運(yùn)的是,近年來,解決這個問題的方法變得容易獲得且價(jià)格低廉。輔助線路是小型企業(yè)的一種選擇,大多數(shù)網(wǎng)絡(luò)路由器都提供 4G 或 5G 網(wǎng)絡(luò)作為備份。雖然不理想,但它使網(wǎng)絡(luò)中斷不再是災(zāi)難,而是帶來更多不便。整合備份連接確實(shí)有成本,但當(dāng)替代方案是辦公室里擠滿了無法工作的員工時,這可能是值得的。
硬件故障
硬件故障可以有多種形式,包括系統(tǒng)不使用 RAID、單個磁盤丟失導(dǎo)致整個系統(tǒng)癱瘓、網(wǎng)絡(luò)交換機(jī)故障和電源故障。
大多數(shù)基于硬件的 IT 災(zāi)難場景都可以相對容易地緩解,但代價(jià)是增加了復(fù)雜性和價(jià)格標(biāo)簽。一個示例是數(shù)據(jù)庫服務(wù)器。這樣的服務(wù)器可以變成具有高度可用性存儲和網(wǎng)絡(luò)的數(shù)據(jù)庫集群。這樣做的成本很容易使單個非冗余服務(wù)器的成本增加一倍。管理員還必須接受培訓(xùn)才能管理這樣的環(huán)境。
硬件故障也會影響云。但是,它通常被抽象出來,并且有多個數(shù)據(jù)副本需要重新生成并繼續(xù)。