云服務并非萬能 大數據保護路在何方
從盛大云看大數據保護現狀
今年的8月6日,盛大云計算官方微博發布了一條微博:《對“物理磁盤損壞導致個別用戶數據丟失”事件聲明》,對其機房物理磁盤損壞導致個別用戶數據丟失表示歉意,并建議用戶在云主機之外也做好數據備份。盛大、云計算,在這兩個關鍵字之下,似乎很難想象也會發生用戶數據丟失事件,更會讓人質疑云計算本身所具有的高可靠性,更有人就此宣稱,盛大云就是一朵偽云。而在筆者看來,以上這個事件更多的是折射出了這樣一個問題,那就是類似云計算這種大數據規模化的應用是不是對備份容災提出了新的要求。從另一個角度來看,已然反映出現有的備份容災解決方案無法應對大數據多樣性(variety)、數量(volume)、速度(velocity)多方面的挑戰。而面對大數據的強烈沖擊,傳統備份容災產品卻可以說是集體黯然失聲。
那么到底備份容災在大數據時代具體遇到了哪些挑戰,又該如何突破傳統,應對大數據這個大挑戰,筆者接下來會從用戶場景和所面對的挑戰這兩個方面做針對性分析。
淺析大數據應用規模化新場景
目前來看與傳統應用場景相比,大數據應用規模化都有哪些新的場景?筆者根據用戶應用場景進行分析,簡單總結出以下兩種應用場景,即:單一數據中心應用、多用戶規模化應用。
單一數據中心應用
近些年,各種數據中心如雨后春筍般建立起來。稍具規模的數據中心就會擁有將近上百臺服務器,四百、五百臺服務器的更是不在少數,這么多的服務器累加起來,總計幾十甚至上百TB的數據總量就不難想象了。由此估算,每天的數據增長量可達上百GB左右。那么要如何保證所有數據的安全,如何控制大量數據備份的時間,縮小備份窗口時間,就成了一個相當令人頭痛的難題。
目前市場上現有的一些傳統備份容災產品其所適用的場合大多數為中小型規模的應用,它們可以完成數十臺服務器的備份容災要求,但是當面對這種大規模的數據中心時,無論從管理還是從性能等各方面都不能達到實際的要求。而讓用戶購入多套相同設備又不太現實,理由有兩個方面:一方面是投入成本上不允許,投入和產出的效率讓人難以接受;另一方面會給管理增加巨大的難度,管理難以到位,會導致更多問題的產生。所以,傳統的一般備份容災產品不可能對大型數據中心進行完全的保護。
多用戶規模化應用
云計算的興起,讓多用戶規模化應用得以發展。數據也成了大多數組織發展的生命線。很多大中型的組織,業務發展跨地域、跨領域,距離的遠近已經無法制約組織的拓展。不過,問題也就這樣隨之而來,組織在全國乃至世界范圍內有多家分支機構,如果每個分支機構都有多臺服務器和幾百GB的數據,那么一般的備份容災產品就無法滿足完整全面的備份容災需求。因為一般的備份容災產品只能部署在每個分支機構,單獨滿足每個分支機構的需求,而不同的機構之間不能形成統一管理的格局,造成了一種分散獨立的局面。而且現實中,一般的組織通常無法為所有的分支機構都配備專業的IT運維管理人員,備份容災產品的專業性決定了又不能由非專業人員來進行操作管理。如果讓IT運維管理人員不停來往奔波于各分支機構,組織有限的資源就這樣被不合理的消耗掉了,又不能獲得良好的管理成效。
由此可見,大數據背景下因大規模的用戶及需求而導致的備份容災規模化趨勢將會面臨著管理、擴展、技術等多方面的挑戰。#p#
規模化應用遭遇備份容災新挑戰
上面我們講到了規模化應用所帶來的新用戶場景,也提到了規模化給備份容災帶來的挑戰,接下來對這些挑戰進行簡單整理羅列。筆者總結歸納下來,這些新挑戰有:管理挑戰、擴展挑戰、技術挑戰。
管理挑戰
傳統的IT管理資源大部分會傾斜在管理和使用環節,用戶購買了一個備份容災產品希望的是減少對應的管理工作。而傳統的產品只能應對最多幾十臺服務器的場景,面對規模化的場景動輒上百臺的服務器,往往需要3-5套系統同時進行備份及容災。這就要求IT運維管理人員需要同時管理這3-5套備份容災系統,這就大大增加了管理的難度。隨著備份系統的增多,管理的效率會下降,同時花費的人力及投資成本會增加。
擴展挑戰
同樣的,我們在面對不斷增長的業務系統,傳統的備份容災產品只能應對十幾二十臺的服務器,隨著業務的增長及拓展,就意味著需要增加更多的備份容災系統來提供足夠的保護,這整個過程是十分僵硬的,所以對大數據的備份容災保護能力的擴展難度是非常大的。
技術挑戰
大容量的挑戰
通常建一個備份系統,可能十幾個盤位就能解決備份容量的需求。可是當面對規模化的上百臺服務器的時候,需要備份的數據可能就是成百TB的量。如何合理滿足這種大數據大容量的要求是個挑戰 。
更小備份窗口的挑戰
更小備份窗口,并不是指對單個服務器備份窗口的挑戰,而更多的是對備份服務器吞吐量的考量。如果備份服務器的吞吐量不合要求,即使備份客戶端跑的再快,服務器卻無法接收,那么性能自然也就不能提升,備份窗口就不能更小,空有足夠的空間,卻來不及備份,自然就無法滿足大數據備份的整體要求。如何滿足大數據環境下備份窗口要求是個挑戰。
有效恢復的挑戰
在一個數據中心環境中,不同的系統服務器所需要的保護也是不同的。可能有些服務器是核心系統,需要應用容災,有些重要服務器需要實時備份,對于一般服務器只要提供定時備份保護。這些服務器中所需要備份的對象也會有很大的差異性,會涉及不同的操作系統和數據結構。這就需要一個統一的保護策略,來保障這些差異性能得到充分的保護,也就是說在面對不同業務系統的時候要有差異性,在面對整個數據中心時要保證統一性。所以在面對大數據環境下不同業務系統,提供更加有針對性、更加有效的恢復是個挑戰。
我們上面列舉了大數據背景下備份容災所面臨的一些新挑戰,那么面對這些挑戰,什么樣的備份容災才能應對呢?我認為大數據的核心問題在于擴展能力:1、 大數據的容量挑戰,意味著需要有簡易的容量擴展能力,傳統磁盤陣列的擴展方式不能滿足要求; 2. 大數據的性能挑戰,隨著容量的加大,性能要求線性的增長,所以,擴展意味著性能的提升; 3. 大數據的可靠性挑戰,傳統磁盤陣列內部RAID級別的數據冗余無法滿足大數據的要求,節點級別的冗余更加迫切;而大數據的挑戰,可行的出路是云計算的思路,通過資源池化、彈性擴展和服務化來實現大數據增長時,按需擴展,包括 容量、性能和可靠性的成長,這才能真正從根本上解決大數據帶來的管理難題。
結語
綜上所述,大數據帶來了大機遇,也迎來了大挑戰。在類似數據中心的應用場景的整體方案規劃過程中,數據保護是一個不容被忽視的問題,而到底備份容災在中大型用戶,面對大數據狂潮該如何落地,我們在此道路上該上下求索,且聽下回分解。