未雨綢繆,為災難恢復提前做好準備
在數(shù)字經(jīng)濟中,業(yè)務連續(xù)性與科技密不可分。從零售和旅游業(yè),到金融和公共事務領域,從服務轉(zhuǎn)移到線上和員工遠程辦公,都意味著企業(yè)比以往任何時候都更加依賴其數(shù)字基礎設施。雖然組織可以采取措施,保護其數(shù)字服務免受諸如用戶操作失誤、系統(tǒng)故障或網(wǎng)絡攻擊等事件的影響,但總有些天災人禍是超出任何企業(yè)所能控制范圍的,例如極端天氣事件、自然災害或區(qū)域性斷電等可能導致的停機和服務中斷的情況。
當此類事件發(fā)生時,如何讓服務和員工快速恢復聯(lián)機至關重要。 因此,企業(yè)必須具備一套健全的、有據(jù)可查的、并且經(jīng)過測試的預案,方案中須有明確的負責人、角色和職責、緊急聯(lián)系人和行動規(guī)則。 但是,光有預案是不夠的,企業(yè)還需要技術能力以恢復到事故前狀態(tài)。這意味著企業(yè)需在既定時間范疇內(nèi)完整恢復數(shù)據(jù)、應用程序和服務,并最大限度地減少任何影響。 從業(yè)務連續(xù)性和技術恢復的角度來看,所有這些都構成了一套穩(wěn)健的流程,企業(yè)必須確保在災難發(fā)生時做好充分準備。
讓團隊嚴陣以待
預測和行動的能力是區(qū)分成功者與失敗者的關鍵。當涉及到從不可預測的技術災難中恢復時,能夠準確預測事發(fā)第一時間的情況和執(zhí)行應對措施變得至關重要。IT 管理者必須將自身置身于此等情況下,從而了解應對措施,而非等待災難發(fā)生才想對策。各種情況可能會非常不同,因此在事情發(fā)生之前從頭到尾地模擬一遍至關重要。
最終,企業(yè)都將依靠其自身的數(shù)據(jù)系統(tǒng)和基礎設施,以在充足的時間范圍內(nèi)完全恢復其關鍵任務的應用程序。但在進入到恢復階段之前,企業(yè)必須培養(yǎng)團隊以做好準備。屆時他們將采取關鍵操作來啟動恢復,這可以根據(jù)企業(yè)的需求分為幾個階段。一般來講,企業(yè)首先要確保擁有一套在當前業(yè)務中部署的應用程序及服務的完整且最新的清單。其次,在確保以上措施后,企業(yè)可考慮按其重要性劃分優(yōu)先級——與企業(yè)內(nèi)部最關鍵的職能一致。在此,企業(yè)須考慮哪些應用程序需優(yōu)先恢復聯(lián)機。例如,在線零售商可能會優(yōu)先考慮恢復其庫存和供應鏈功能后,才考慮恢復其電商平臺功能。而律師和市場營銷等服務性行業(yè)可能會優(yōu)先考慮其電子郵件和協(xié)作應用程序的恢復以實現(xiàn)其公司的通信功能。
一旦企業(yè)考慮好了需要優(yōu)先聯(lián)機的應用程序,便可開始制定行動計劃,并將其記錄下來,集中存儲并備份至少在兩種其他形式的媒介(異地和離線)。此行動計劃需盡量詳細和具體,并且還必須做好最壞的打算,比如假設您的系統(tǒng)管理員主管在休假或因病請假了,團隊需在沒有主管指導的情況下恢復數(shù)據(jù)系統(tǒng)。為了應對此類情況所制定的計劃,除關鍵行動和指令外,還應詳列聯(lián)系電話,以重新恢復整個企業(yè)的溝通。諸如“誰需要立即被通知?”、“ IT 團隊需要致電誰來獲取重要信息?”等類似問題都必須在計劃中,以及考慮實用性。“管理員團隊是否需要夜以繼日地恢復數(shù)據(jù)中心的服務器?”、“他們吃和住如何解決?”,最詳細的災難恢復 (DR) 計劃總是盡心盡力,甚至包括了從披薩外賣公司到出租車公司和酒店的信息。
自動恢復
除根據(jù)優(yōu)先恢復的關鍵業(yè)務功能制定恢復計劃外,企業(yè)還須確保其數(shù)據(jù)系統(tǒng)在所有形式的存儲中都受到備份和災難恢復的全面保護。其中,異地和離線數(shù)據(jù)備份有助于減輕災難性事件的影響。在此,Veeam 提倡 3-2-1-1-0 備份原則。每個企業(yè)應至少在不少于兩種不同類型的介質(zhì)上保存至少三個重要數(shù)據(jù)副本,其中至少一個異地與一個離線,沒有未經(jīng)驗證的備份,或備份完成時無誤。 當然,備份和災難恢復是兩個密不可分的解決方案,但我們不應該將兩者混為一談。 災難恢復是指一連串旨在確保公司數(shù)據(jù)存活的舉措和流程,無論災難或危機的范圍如何,重點是為了盡快恢復 IT 服務。
使用第三方災難恢復提供商提供的災難恢復即服務 (DRaaS),企業(yè)只需單擊一下即可自動測試、記錄和執(zhí)行災難恢復計劃,從而實現(xiàn)從單個應用程序到整個站點的恢復。回到規(guī)劃過程,企業(yè)可以根據(jù)他們需要的服務水平協(xié)議 (SLA) 選擇最佳保護方法。災難恢復計劃背后的基本問題和目標需要是:業(yè)務需要多快的速度恢復?無論是指讓關鍵任務應用程序重新上線,還是完全恢復之前的數(shù)據(jù)。借助 DRaaS,客戶可以利用一種可完全掌控的、受監(jiān)控的和安全的方法來保護關鍵數(shù)據(jù),而無需維護異地存儲庫。總而言之,災難恢復最佳實踐結(jié)合了以業(yè)務為主導和以 IT 為中心的戰(zhàn)略,以確保整個業(yè)務的業(yè)務連續(xù)性。唇亡齒寒,考慮到企業(yè)對其數(shù)字基礎設施的依賴,他們需要一個強有力的計劃以及能夠充分保護業(yè)務的現(xiàn)代數(shù)據(jù)保護解決方案。