自動精簡配置&重復數據刪除核心技術點及其經濟效應探究
在當前日益洶涌的金融危機逐漸影響實體經濟的情況下,企業面臨存儲擴容需求時不得不精打細算,為了降低最終擁有成本(TOC),除了減少初次采購成本,也希望盡可能減少企業今后的運營維護成本。重復數據刪除技術作為時下最熱門的存儲優化技術,能顯著降低存儲設備物理介質消耗,并減少數據中心對空調,空間,和災備的消耗,還可以與本文涉及的自動精簡技術無縫配合,極大降低存儲系統的維護管理成本,顯著提高企業存儲系統的利用率,實為抵御當前經濟危機的又一利器。
首先介紹存儲系統的自動精簡配置(Thin Provisioning)技術。自動精簡配置技術擴展了存儲管理功能,雖然實際分配的物理容量小,但可以為操作系統提供超大容量的虛擬存儲空間。隨著應用寫入的數據越來越多,實際存儲空間也可以及時擴展,而無須手動擴展。換句話說,自動精簡配置提供的是“運行時空間”,可以顯著減少已分配但是未使用的存儲空間。
如下左圖所示為使用傳統配置方式創建了3個卷。整個存儲系統有2TB的可用存儲空間。卷1的大小是500GB,其中有100GB實際數據,另外400GB是已經分配但是未使用的空間。卷2的大小是800GB,其中200GB實際數據,另外600GB為已分配但未使用的空間。卷3的大小是550GB,其中50GB實際數據,另外500GB為已分配但未使用的空間。整個存儲系統有350GB的實際數據,1.5TB已分配但未使用的空間,并***剩下150GB可用空間給其他應用。
同樣的2TB存儲系統采用自動精簡配置技術之后,結果較傳統方法有顯著差異。系統管理員同樣創建這3個卷,使用自動精簡配置之后,由于存儲空間是在數據寫入過程中動態申請分配的,因此就不存在已分配但未使用的空間。所以采用自動精簡配置之后整個存儲系統里同樣有350GB數據,但有1.65TB可用空間。相對于使用傳統配置方式時的150GB,采用自動精簡配置使得可用空間增加了11倍!
由此可以看出,采用自動精簡配置可以把存儲空間的利用率提高到近乎100%。
另外自動精簡配置不僅可以提高存儲空間的利用率,降低IT人員進行存儲管理的復雜度,還可以極大減少存儲系統擴容的規模,增加現有存儲系統支持的應用服務器的數量。
以下對自動精簡配置的優點進行簡單的總結:
l 用戶可以創建更多的卷,單個卷的空間可以更大,并可以動態地管理各個卷的大小。
l 用戶可以在初次購買更少的存儲介質,并在隨后按需增加磁盤容量。
l 在創建卷時不需要進行深入的容量規劃,減少IT管理人員存儲配置的工作量,避免預估不當造成的存儲空間浪費?;蛘叽鎯臻g不夠導致后續中斷業務以進行擴容升級。
l 存儲介質的空間利用率顯著提高,相應地在同樣的存儲空間下可以支持更多的應用服務器,提升存儲系統的利用率。
存儲介質的空間利用率顯著提高,相應地在同樣的存儲空間下可以支持更多的應用服務器,提升存儲系統的利用率。
重復數據刪除(De-duplication)技術,主要是對存儲數據流以一定的目標尺寸進行指紋校驗,對于其中重復出現的數據單元,在實際寫入存儲介質時,只需記錄相應的指紋記錄位置即可,因此可以極大降低存儲介質消耗?!叭ブ芈省边@個參數就是用來定義重復數據刪除中的優化率,它等于原數據大小除以去重之后的數據大小,實際去重率隨去重模塊部署在存儲系統的位置以及數據的重復率有較大差異。對于次級備份數據,一般的去重率在10~20:1之間。另外還可以配合硬件壓縮,像Hifn公司的DR系列硬件加速無損壓縮板卡,可以在不影響備份設備性能的前提下取得2:1的壓縮比。這樣兩者結合,可以實現20~40:1的數據縮減比。
當前重復數據刪除主要被用于次級備份業務,一般和虛擬磁帶庫(VTL)處在同一位置。如果說IP-SAN市場的崛起是源于對鏈路要求從FC到IP的降級,那么支持重復數據刪除的IP-SAN設備會更加加速這樣的趨勢。因為經過重復數據刪除和壓縮處理之后,應用產生的數據被大量縮減,使得之前利用FC構建的主存儲和次級存儲之間的鏈路的負擔顯著減輕,從而完全可以被更經濟的IP鏈路所取代。
2009年,自動精簡配置和重復數據刪除這兩種技術可以顯著提升存儲介質的利用率,進而提升存儲系統的利用率,減小企業IT運營成本,降低管理成本,有利于企業在經濟發展面臨困境時順利過冬。