數據管理之有“備”無患
在新概念層出不窮的IT圈子里,備份這個話題實在是太old了,很容易就被小伙伴們忽視掉。然而,數據備份對生產運行乃至企業安全來說,意義都是非常巨大的,它是數據安全的***一道防線。
一、案例回顧
1、攜程“癱瘓門”事件:2015年5月28日11時左右,攜程官網、APP同時崩潰,直到當晚23:30左右才恢復正常。對于故障原因,業界有很多種說法。攜程官方解釋是:由于員工錯誤操作,刪除了生產服務器上的執行代碼導致。受此影響,次日攜程股價盤前暴跌11.6%。
2、GITLAB數據誤刪事件:2017年2月GitLab一位身在荷蘭的疲憊的系統管理員在數據庫維護時,不小心用rm -rf誤刪了300GB生產數據,等反應過來立即取消命令后該文件夾只剩下4.5GB數據。最終只能通過一個6小時前的人工備份進行恢復。數據丟失超過6小時。
3、勒索病毒事件:2017年蠕蟲病毒大面積爆發并席卷全球,對很多企業造成了利益損失。某受災企業雖有備份機制,但在恢復數據過程中遇到各種問題,如備份失效、備份數據老舊、備份數據恢復失敗等等,最終只能認栽并付贖金。
二、數據庫備份相關概念
數據:信息系統存儲的數字化信息。按數據類別可分為應用數據(包括應用數據庫中的數據、應用參數、日志等),系統、網絡、設備數據;按運行環境類別可分為生產數據、測試數據、研發數據等。
備份:按備份目的可分為系統級備份和應用級備份;按備份頻度可分為定期備份和非定期備份(如變更前備份);按備份介質保存位置可分為本地備份和異地備份(包括同城異地)。備份的***特點是“固化”和“離線”,我行現有備份手段包括NBU磁帶備份、數據庫dump導出、磁盤備份、光盤備份等。
抽檢:指通過技術手段驗證備份介質的可用性和備份數據的有效性的過程。
三、數據庫備份規范要求
1.明確備份策略。應用上線前,應根據可用性要求制定系統備份策略和應用備份策略,包含要素有:備份內容、備份周期、備份數據保留時間等。
2.根據要求落實異地保存。應用系統按照災備等級實施異地備份或保存。
3.先備份后變更。應用系統升級等重大變更前,應對變更涉及的生產數據進行版本升級前備份。
4. 定期抽檢。定期檢查備份執行情況,對備份數據實施抽檢驗證,核實備份數據的可靠性。
四、Q&A
工小白
我負責應用是高可用部署,部署了多個節點,還需要單獨備份干嘛?
高可用和備份是兩個維度的概念。高可用模式下,對生產節點做一個誤刪除,容災節點數據也會隨著同步付之一炬。因此,備份、備份、還是備份,重要的事情說三遍!