重復數據刪除技術對備份有著深刻影響
導讀:重復數據刪除是一種非常高級的數據縮減方式,可以極大的減少備份數據的數量。這種技術通過減少存儲的數據量,改變數據保護方式,卓越的提升了磁盤備份方式的經濟性。重復數據刪除被業界公認為備份技術的下一代發展步驟,是今日數據中心的"必備"技術。可重復數據的刪除技術對備份又會產生一定的影響。
重復數據刪除應運而生
重復數據刪除是一項非常新的技術,專門用于在減少需要備份的數據量、***化存儲利用率的同時,使更多的備份數據在線保留更長時間。通常來講,重復數據刪除技術會將***的備份數據與已有的之前的備份數據進行比對,從而消除冗余數據。這項技術的優勢在于數據的減少不僅使存儲的效率更高、成本更節約,帶寬的利用也降到***,使更經濟、更快速的實現備份數據的遠程復制成為可能。然而,目前市場中的重復數據刪除解決方案還有很大差異,有些解決方案會使備份處理的速度變的很慢,甚至引發無法預計且不可恢復的數據丟失。
塊級重復數據刪除
多年以前的重復數據刪除技術,可以看作是文件級的技術,當時稱之為“單一實例存儲(SingleInstanceStore,SIS)”,通過SIS技術,整個文件系統或電子郵件系統的重復文件可以被減少為單一的拷貝,當再出現這一文件時,會被指向到這一單一拷貝,從而減少容量需求。這一技術通常被用于電子郵件管理及歸檔系統。
今天的重復數據刪除技術利用了與SIS類似的數據縮減概念,但卻使之向前邁進了一大步–實現了塊級(子文件)重復數據刪除。當讀取數據時,系統利用Hash算法識別唯一的數據塊,系統將保留Hash索引,每個Hash編碼指向一個不同的數據塊。當新的備份發生時,會自動的與現有的塊進行比對,如果索引中已經有相同的塊,數據將會被刪除或被指向塊的指針所代替;反之,則會被保存并在索引中為其創建一個新的Hash編碼。這里提到的唯一數據塊的大小,會根據用戶選擇的不同的重復數據刪除解決方案而不同,平均大小在4KB-24KB之間。
與文件級SIS技術相比,塊級的重復數據刪除技術可以說更具優勢。它可以在不同的文件或應用中消除冗余數據塊。比如,如果一個文件只做了想當小的一點修改并保存,塊級重復數據刪除技術則將只保存發生變化的數據塊。按這種方式,塊級重復數據刪除可以提供更好的壓縮比率,特別是應用于巨大數據量的情況下,如數據庫或全備份之后。
下面的例子進一步說明了SIS和塊級兩種重復數據刪除技術的結果比較。
一個企業向1000個郵件地址發出一封帶有注冊內容的活動邀請函,傳統的備份應用將會把文件備份1000次。SIS解決方案可以識別出文件是相同的,將只會保留一份備份,然后生成999個指針指向那個唯一的備份,因此,大概節省了99.9%的空間。但是,之后這1000個參會人可能會將注冊內容填好后回復給發件人,由于他們的名字不同,SIS解決方案就會備份1000份回執。
塊級解決方案在發出邀請函的時候執行了相同的重復數據刪除處理,也實現了99.9%的存儲空間節省。但是,當收到1000份參會人的回執時,塊級解決方案會發現每個回執的大部分內容與***封收到的是相同的并已經備份過,因此,它只會對其它999封回執的相異數據塊(塊級)進行備份。這種方法與SIS技術相比,則還可以節省額外的99.9%的存儲空間。
綠色存儲與重復數據刪除
由于塊級重復數據刪除技術只保存發生變化的數據,極大的減少了所需的備份容量,使用戶不用再像從前一樣購置大量磁盤,從而將用戶備份系統的總成本降到***。更少的磁盤致使存儲系統更少,電力及制冷需求更小,同時還降低了整體系統的復雜性。
與傳統的磁帶備份解決方案相比,重復數據刪除技術完全改變了磁盤備份的經濟性。通過這一技術,更多的用戶可以負擔得起用磁盤備份取代整個或是部分磁帶備份的解決方案。磁盤備份相對于磁帶備份來說,提供了更好的備份及恢復性能。通過利用磁盤備份的方式,用戶可以進一步改善他們的服務品質協議(Service-LevelAgreements,SLAs)。
當通過數據復制實現災備時,重復數據刪除技術也可以帶來卓越利益。由于減少了備份數據量,重復數據刪除技術將主站點與遠程數據中心之間的帶寬需求、數據傳輸成本、復制時間都降到***。企業利用相對經濟的WAN網絡即可在任意地理空間范圍內執行復制,實現了額外的成本節約。
重復數據刪除最適用于哪里?
理論上講,重復數據刪除技術可以用于任意地點存在的數據。它可以與在線或是離線的數據一起工作,可以在文件系統或是數據庫,也可以在其它應用。總的來說,哪里有大量的重復數據,它就能在哪呈現出***的利益回報。
而***的應用示例是在企業級備份。企業大都是每天做一次全備份,兩日的全備份中通常只有很小部分不會超過5%的數據是不同的,大部分備份扇區都是相似的。這種情況下,重復刪除為備份系統帶來了***的利益回報。因此,大多數重復數據刪除解決方案都是專為備份系統而設計的。
【編輯推薦】