重復數據刪除技術實施主存儲優化
主要文件系統存儲優化(也就是在同樣的空間塞進更多的數據)繼續在日益普及。這里的挑戰是主存儲的重復數據刪除并不是沒有規則的。你不能刪除這個重復的數據,也不能刪除那個重復的數據,你必須要認識到刪除重復數據之后對設備性能的影響。
EMC已經宣布了在自己的Celerra平臺上刪除重復數據的功能。NetApp使用這個功能已經有一段時間了。其它廠商也以積極的方式增加這個功能,其方法是在數據不流動之后對數據進行壓縮和刪除重復數據。然后,Storwize等公司一直以在線實時壓縮的方式提供這種功能。
正如存儲虛擬化和精簡配置已經證明的那樣,當你不必妥協的時候,主存儲將更好。為主存儲強加一些條件的問題是事情會變得更復雜。這種復雜性會導致人們不適用這個技術。技術越透明和越通用,取得成功的機會就越大。
一些主存儲優化的挑戰是它基本上依賴于你擁有的數據類型和訪問那個數據的工作量。刪除重復數據要產生一些好處的話,顯然必須要有重復的數據。因此,每個星期進行完整的備份是刪除重復數據的理想的應用程序。另一方面,主存儲不都是重復的數據。
除了主存儲之外,刪除重復數據還與繁重的輸入/輸出任務和隨機的讀/寫輸入輸出有關。在這些情況下,用戶也許會感受到應用重復數據刪除的性能影響。
因此,大多數廠商建議把這個技術的應用限制在家目錄(home directories)和VMware鏡像方面,因為這些地方數據重復的可能性非常高,工作量主要是讀數據。
特別是不要在數據庫中使用刪除重復數據的功能。人們擔心,數據庫中有大量的重復的數據,刪除重復的數據會對性能產生影響。正如我們在數據庫存儲優化的文章中指出的那樣,減少甲骨文數據庫數據、聯機和實施壓縮解決方案也許更適合這里。數據庫是最適合壓縮的,無論是否有重復的數據,實時的壓縮在大多數情況下都不會對性能產生直接的影響。
隨著數據增長繼續加快,將需要更多的數據優化。使用多種技術也許是阻止這個潮流的唯一途徑。壓縮也許會廣泛地應用。作為應該應用于具體工作量的刪除重復數據的補充,這種刪除重復數據的做法應該應用于存檔,并且不在主存儲中使用。所有這些都需要能夠提高人員效率和資源效率的工具。
【編輯推薦】