以拷貝管理系統(tǒng)助力數(shù)據(jù)瘦身減量
對(duì)今天任何企業(yè)而言,信息和數(shù)據(jù)都已成為其核心資產(chǎn),維護(hù)這部分信息正是IT部門的關(guān)鍵要?jiǎng)?wù)。在常見的業(yè)務(wù)流程中,IT人員會(huì)將每天的數(shù)據(jù)備份復(fù)制,用于其他各種用途。不幸的是,這部分?jǐn)?shù)據(jù)存儲(chǔ)往往消耗過量的存儲(chǔ)空間,從而加緊了原本便不寬裕的存儲(chǔ)預(yù)算。
數(shù)據(jù)無休止增長(zhǎng)的解決方案之一便是使用拷貝管理系統(tǒng)。雖然這仍屬于較新出現(xiàn)的技術(shù),但市場(chǎng)上已經(jīng)有不少小型的拷貝數(shù)據(jù)管理(CDM)廠商,而大型存儲(chǔ)系統(tǒng)供應(yīng)商則將此功能添加到現(xiàn)有產(chǎn)品之中。
為何針對(duì)拷貝?
數(shù)據(jù)副本對(duì)IT部門有許多種用途。除了用于災(zāi)難恢復(fù)的拷貝會(huì)實(shí)際將所有數(shù)據(jù)都遷移至另一個(gè)平臺(tái),絕大多數(shù)的只是時(shí)間點(diǎn)拷貝,表示其只代表數(shù)據(jù)在某個(gè)特定時(shí)刻的狀態(tài)。舉例而言,快照每小時(shí)或每天都會(huì)生成,以便在發(fā)生用戶錯(cuò)誤刪除等操作時(shí),IT部門能夠快速找回或更正相關(guān)數(shù)據(jù)。
數(shù)據(jù)拷貝亦可以用于搭建測(cè)試環(huán)境,供應(yīng)用程序開發(fā)使用。這種使用場(chǎng)景會(huì)從主備份中復(fù)制出一份拷貝,以確保主拷貝不會(huì)損壞而無法滿足合規(guī)或引起生產(chǎn)數(shù)據(jù)無法恢復(fù)的風(fēng)險(xiǎn)。
在服務(wù)器虛擬化技術(shù)出現(xiàn)之前,應(yīng)用程序使用專門的開發(fā)與用戶驗(yàn)收培訓(xùn)(UAT)系統(tǒng),并在開發(fā)環(huán)境中測(cè)試代碼,由UAT測(cè)試系統(tǒng)負(fù)載。
現(xiàn)在,伴隨著應(yīng)用程序變得越來越虛擬化,并采用容器技術(shù),更改應(yīng)用程序的過程更多采取DevOps的方式,從而確保快速迭代與上市。這意味著開發(fā)人員需要同時(shí)提供多個(gè)測(cè)試數(shù)據(jù)副本,即使其中的大部分只會(huì)保留幾個(gè)小時(shí)或幾天。
維護(hù)多個(gè)數(shù)據(jù)副本令企業(yè)組織頭疼不已。每個(gè)副本必須有負(fù)責(zé)人跟進(jìn)其狀態(tài),以便在某個(gè)時(shí)刻將其釋放。在備份領(lǐng)域,已經(jīng)有些許流程來對(duì)此做生命周期管理。備份通常根據(jù)時(shí)間周期循環(huán)往復(fù)。
但這不適合測(cè)試或開發(fā)數(shù)據(jù),因此仍需要開發(fā)出新的流程。這或?qū)⒊蔀榭截悢?shù)據(jù)管理的潛在市場(chǎng)。
海量復(fù)制
伴隨著向服務(wù)器虛擬化的轉(zhuǎn)變,我們之前所討論的二級(jí)數(shù)據(jù)使用都通過虛擬機(jī)鏡像中獲得。現(xiàn)代化的虛擬機(jī)管理程序(Hypervisor)提供接口和API ,從而可以在數(shù)據(jù)塊層級(jí)提取虛擬機(jī)數(shù)據(jù),讓備份過程相對(duì)簡(jiǎn)單化。
虛擬機(jī)管理程序通常也能實(shí)現(xiàn)快照功能,但這絕非是無償?shù)摹1A舳喾菘煺眨绕涫窃诤笃诤喜⑦@些快照更新,會(huì)對(duì)運(yùn)行在虛擬機(jī)中的應(yīng)用程序性能產(chǎn)生重大影響。這是拷貝管理系統(tǒng)可以解決的另一項(xiàng)問題。
整合帶來效益
有許多內(nèi)部的IT流程和系統(tǒng)會(huì)為各種用途進(jìn)行時(shí)間點(diǎn)拷貝。隨著服務(wù)器虛擬化技術(shù)的高度滲透,大多數(shù)通過API采集數(shù)據(jù)的業(yè)務(wù)流程都用這些相同或相似的接口來提取數(shù)據(jù)。將這些功能整合至單一平臺(tái)頗具意義。
整合能夠帶來下列顯著的改善之處:
- 節(jié)省成本。因各種用途而產(chǎn)生的數(shù)據(jù)(歸檔、備份、測(cè)試和開發(fā))可以集中到單個(gè)硬件集群上,避免了同時(shí)運(yùn)行多個(gè)平臺(tái),減少相關(guān)的部署、維護(hù)和升級(jí)成本。同時(shí),這樣做也減少了硬件和相應(yīng)的空間,并降低冷卻成本。
- 避免對(duì)業(yè)務(wù)運(yùn)營(yíng)的影響。將事務(wù)性工作遷移到另一平臺(tái)上可以減少對(duì)生產(chǎn)系統(tǒng)的影響。這樣做可以消除快照管理(和性能)的開支。你可以在輔助平臺(tái)上管理數(shù)據(jù)恢復(fù),而非去影響生產(chǎn)系統(tǒng)。這樣還能降低意外覆蓋生產(chǎn)系統(tǒng)的風(fēng)險(xiǎn)。
- 減少安全風(fēng)險(xiǎn)。對(duì)業(yè)務(wù)運(yùn)營(yíng)而言,將二級(jí)數(shù)據(jù)放在另一個(gè)平臺(tái)上可以輕松分割安全權(quán)限。對(duì)需要訪問生產(chǎn)鏡像的團(tuán)隊(duì),無論其處于何種目的,都可以從安全的角度分離出來,單獨(dú)審計(jì)。
那么,市場(chǎng)上為什么直到今天才出現(xiàn)CDM的成功部署?有一些技術(shù)創(chuàng)新使得拷貝管理系統(tǒng)比運(yùn)行單獨(dú)的平臺(tái)更具吸引力。
***項(xiàng)創(chuàng)新技術(shù)是重復(fù)數(shù)據(jù)刪除,通過消除重復(fù)的數(shù)據(jù)塊(通常在數(shù)據(jù)塊級(jí)別)從數(shù)據(jù)集合中消除冗余的物理數(shù)據(jù)。事實(shí)上,該技術(shù)僅保留單個(gè)物理副本,然后用元數(shù)據(jù)和指針來映射數(shù)據(jù)的邏輯和物理關(guān)系。
二級(jí)數(shù)據(jù)通常是高度冗余的,其中創(chuàng)建了虛擬機(jī)和虛擬機(jī)下層鏡像的多個(gè)副本。這使得重復(fù)數(shù)據(jù)刪除能夠節(jié)省下相當(dāng)可觀的存儲(chǔ)量,尤其是在組合了多個(gè)時(shí)間點(diǎn)的數(shù)據(jù)源(如備份和數(shù)據(jù)鏡像)時(shí)。
今天硬件平臺(tái)(其中的絕大部分基于Intel x86架構(gòu))處理能力的提高代表著你可以無需額外的定制化硬件,即可執(zhí)行諸如重復(fù)數(shù)據(jù)刪除、過零檢測(cè)和壓縮等技術(shù)。這使得拷貝管理技術(shù)更專注于通過軟件提升價(jià)值,即便在最終產(chǎn)品上,仍會(huì)以軟硬件組合的形式銷售。
我們還能夠?yàn)檫@項(xiàng)創(chuàng)新增添閃存技術(shù)。閃存為隨機(jī)數(shù)據(jù)訪問操作(通常是經(jīng)過重復(fù)數(shù)據(jù)刪除帶來了極高的性能,并且伴隨著價(jià)格持續(xù)下降,其在設(shè)備內(nèi)的部署會(huì)逐漸增多。
從硬件上分離開
拷貝管理系統(tǒng)通常被部署為獨(dú)立的平臺(tái),而非直接對(duì)接生產(chǎn)系統(tǒng)。這樣的設(shè)計(jì)有助于遵循最基本的備份原則,即從物理上分開平臺(tái)與生產(chǎn)系統(tǒng)的數(shù)據(jù)聯(lián)系。從邏輯上將主數(shù)據(jù)與二級(jí)數(shù)據(jù)隔離開,甚至在需要的情況下將數(shù)據(jù)存儲(chǔ)到遠(yuǎn)程。
二級(jí)平臺(tái)還可以處理與主存儲(chǔ)不同的數(shù)據(jù)。對(duì)生產(chǎn)端的主數(shù)據(jù)而言,其目的是盡可能快地滿足應(yīng)用程序的I / O請(qǐng)求,而不需要快照。通過拷貝管理技術(shù),數(shù)據(jù)不斷變化,應(yīng)用程序不斷更新存儲(chǔ),而將訪問歷史數(shù)據(jù)留給輔助平臺(tái)完成。
因此,拷貝管理系統(tǒng)中的數(shù)據(jù)存儲(chǔ)和檢索方式必須結(jié)構(gòu)化,以便不論是訪問六個(gè)月或五分鐘之前的數(shù)據(jù)都不會(huì)對(duì)性能產(chǎn)生什么影響。這也意味著數(shù)據(jù)的內(nèi)部結(jié)構(gòu)需要不同于生產(chǎn)系統(tǒng)。數(shù)據(jù)結(jié)構(gòu)和相關(guān)元數(shù)據(jù)要能夠提供諸如搜索之類的高級(jí)功能,這樣增加了作為備份和歸檔平臺(tái)的CDM的總體價(jià)值。
擴(kuò)展至云端
拷貝管理系統(tǒng)可以重復(fù)利用公有云帶來的靈活性。諸如Amazon Web Services、Microsoft Azure和Google Cloud Platform所帶來的超大規(guī)模服務(wù)可以提供近乎***的計(jì)算和存儲(chǔ)資源,根據(jù)實(shí)際消費(fèi)逐月收費(fèi)。公有云將資產(chǎn)購(gòu)置轉(zhuǎn)化為服務(wù)購(gòu)買,只收取所使用的資源,而不用為資源的建設(shè)買單。
拷貝管理系統(tǒng)擴(kuò)展至公有云意味著企業(yè)組織能夠卸下陳舊數(shù)據(jù)的包袱,這些數(shù)據(jù)不太會(huì)馬上被用來進(jìn)行恢復(fù)或測(cè)試。CDM系統(tǒng)可以有效地成為應(yīng)用程序的歸檔工具(這也就是為什么搜索會(huì)成為一項(xiàng)重要的特性)。
伴隨著CDM在云端技術(shù)支持的日益成熟,我們可以想象未來可以將應(yīng)用程序直接部署在公有云端,進(jìn)行測(cè)試/開發(fā)工作,不需要將數(shù)據(jù)存儲(chǔ)到現(xiàn)場(chǎng)。這會(huì)大幅度降低成本,而且只是運(yùn)營(yíng)成本。
領(lǐng)先的拷貝數(shù)據(jù)管理廠商能夠提供哪些功能?
現(xiàn)在我們對(duì)CDM可以實(shí)現(xiàn)的內(nèi)容有更清晰地認(rèn)識(shí),那么接下來簡(jiǎn)要介紹下今天市場(chǎng)上領(lǐng)先的拷貝管理系統(tǒng)。這些產(chǎn)品經(jīng)由市場(chǎng)權(quán)威人士的廣泛研究確定,其中涉及到哪些產(chǎn)品最適合用于作為行業(yè)購(gòu)買標(biāo)準(zhǔn)。
- Rubrik和Cohesity都通過軟硬件結(jié)合的方式來處理拷貝管理。 這些拷貝管理系統(tǒng)通常可以橫向擴(kuò)展,并支持與公有云的對(duì)接。
- Actifio和Druva提供的軟件都可以獲取現(xiàn)有硬件平臺(tái)上的數(shù)據(jù),包括虛擬服務(wù)器環(huán)境和傳統(tǒng)應(yīng)用環(huán)境。
- Catalogic Software可以利用底層存儲(chǔ)平臺(tái)的快照功能,管理來自EMC、IBM和NetApp存儲(chǔ)陣列上的快照。
- Hitachi Data的Instance Director可以管理Hitachi Data System的企業(yè)級(jí)的Virtual Storage Platform 和Hitachi NAS Platform,支持諸如Oracle、Exchange、SQL Server和SAP HANA等傳統(tǒng)應(yīng)用程序。
- Dell EMC所提供Enterprise Copy Data Management可以管理Dell EMC的 VMAX,XtremIO以及Data Domain平臺(tái)之間的數(shù)據(jù)。
- Delphix軟件專注于解決數(shù)據(jù)庫(kù)的拷貝管理問題。
- Commvault在其包羅萬(wàn)象的數(shù)據(jù)管理平臺(tái)中提供了一系列類似CDM的功能。