企業(yè)如何制定正確的災難恢復流程
隨著越來越多的企業(yè)受到網(wǎng)絡(luò)犯罪的威脅,災難恢復(DR)在過去幾年中對業(yè)務(wù)優(yōu)先級的重要性日益增加。
但是,IT災難不僅限于網(wǎng)絡(luò)攻擊,硬件故障、人為錯誤、停電以及颶風或地震等自然災害也有可能破壞企業(yè)的業(yè)務(wù)流程,并將有價值的數(shù)據(jù)置于風險之中。
這凸顯了企業(yè)需要采取措施確保最小化停機時間的重要性,不過好在很多企業(yè)正在為此做出積極的響應。根據(jù)Spiceworks公司最近的一項研究,95%的組織都制定了災難恢復計劃,其中90%的計劃包括災難恢復(DR)計劃中的數(shù)據(jù)完整性和備份。
其他領(lǐng)域包括維護網(wǎng)絡(luò)和互聯(lián)網(wǎng)連接(62%),電源/電力連續(xù)性(57%)和本地服務(wù)器/應用程序正常運行時間(57%)。但是只有28%的企業(yè)表示,在其災難恢復計劃中包含云計算或托管服務(wù),考慮到現(xiàn)在有大量的企業(yè)依賴基于云計算的平臺,這一點令人驚訝。
這表明,災難恢復并沒有一個萬能的解決方法,企業(yè)需要投資滿足其獨特需求,并確保選擇最適合其特定需求的災難恢復解決方案。
尋找合適的人選
企業(yè)需要回答的第一個問題是“災難恢復解決方案如何適合現(xiàn)有的基礎(chǔ)設(shè)施?”。一般來說,大多數(shù)探索和采用災難恢復解決方案的企業(yè)屬于三個部門之一:擁有物理數(shù)據(jù)中心,并希望其災難恢復服務(wù)基于數(shù)據(jù)中心基礎(chǔ)設(shè)施的組織;擁有物理數(shù)據(jù)中心,但希望其災難恢復解決方案基于云平臺中的組織;以及希望其數(shù)據(jù)中心基礎(chǔ)設(shè)施和災難恢復解決方案都是基于云計算的組織。
對于將數(shù)據(jù)存儲在物理數(shù)據(jù)中心,并希望災難恢復位于數(shù)據(jù)中心基礎(chǔ)設(shè)施上的組織來說,它們通常需要單獨的副本環(huán)境,以便能夠提供全部或部分客戶的服務(wù)。這可能是一種成本高昂的方法,因為企業(yè)必須考慮與維護設(shè)施、支付電力和購買額外硬件相關(guān)的成本。
而擁有物理數(shù)據(jù)中心但希望其災難恢復解決方案位于云平臺中的組織,以及希望其數(shù)據(jù)中心基礎(chǔ)架構(gòu)和災難恢復解決方案基于云計算的組織,都依賴云計算提供商的數(shù)據(jù)中心作為恢復站點。
雖然每種方法各有利弊,但基于云計算的系統(tǒng)被證明是最具成本效益和最有效的方法,可以最大限度地減少災難事件的影響。但是如前所述,最有效的災難恢復計劃是滿足業(yè)務(wù)特定需求的計劃。
可以理解,在這三種環(huán)境中實施災難恢復所需的流程和解決方案(內(nèi)部部署、混合部署或云計算)各不相同。企業(yè)可以根據(jù)需求制定計劃,同時考慮到需要保護的不同基礎(chǔ)設(shè)施的性質(zhì)以及停機對業(yè)務(wù)的影響。
那么,在制定災難恢復計劃時,企業(yè)需要記住什么?將如何選擇確保正確的解決方案?
規(guī)劃災難恢復
對于任何災難恢復策略,第一步是將業(yè)務(wù)應用程序與服務(wù)級別目標相匹配,其中有兩個特定的衡量參數(shù):恢復點目標(RPO)和恢復時間目標(RTO)。
恢復點目標(RPO)表示發(fā)生災難時業(yè)務(wù)流程的數(shù)據(jù)丟失容限(即數(shù)據(jù)丟失量超出業(yè)務(wù)需求可接受的數(shù)量),而恢復時間目標(RTO)表示在中斷后恢復業(yè)務(wù)服務(wù)所需的時間。不同的應用程序?qū)⒏鶕?jù)其重要性和業(yè)務(wù)類型而有不同的要求。例如,eBay公司或亞馬遜公司等主要在線零售商將要求其核心電子商務(wù)系統(tǒng)具有較低的恢復點目標(RPO)和恢復時間目標(RTO),而規(guī)模較小的企業(yè)中的一些應用程序能夠在24小時內(nèi)脫機。
通過映射其環(huán)境并分析特定應用程序的風險和要求,企業(yè)可以確定最有效地滿足恢復點目標(RPO)和恢復時間目標(RTO)參數(shù)的災難恢復解決方案。他們可能會意識到,內(nèi)部部署方法最符合其未來目標,或者將所有內(nèi)容移至云端是滿足客戶需求的最佳方式。
企業(yè)可能還必須考慮內(nèi)部可用的技術(shù)技能水平。 雖然這對于擁有大型IT團隊的大規(guī)模組織來說并不是什么問題,但是那些根本無法獲得所需技能的小規(guī)模組織來說,可能不得不選擇托管的基于云計算的災難恢復服務(wù)。
最后,重要的是要記住,不同的需求需要不同的方法實施正確的災難恢復解決方案滿足特定需求,因此企業(yè)必須分析其基礎(chǔ)設(shè)施類型,并將這些需求考慮在內(nèi)。
在這個持續(xù)可用性預期的時代,很多企業(yè)根本無法承受停機的損失,當然必須投資于防止災難發(fā)生的解決方案,但當這些解決方案無法阻止災難發(fā)生時,企業(yè)必須準備好立即做出反應,否則將會面臨客戶投訴的風險。