?譯者 | 朱先忠
審校 | 孫淑娟
引言
當今,管理數據存儲的任務變得越來越復雜,以致于IT團隊不得不與本地、直連存儲、存儲區域網絡、網絡連接存儲和云存儲卷等各種類型的存儲問題展開各種極其復雜的斗爭。
團隊成員們可能正在部署超聚合系統,或者使用云存儲技術的內部部署實現。而且,他們有可能在使用幾種互不兼容的存儲協議,尤其是對于非結構化數據方面。所有這些都是隨著業務對數據的要求越來越高而發生的。
這促使人們對全局文件系統(Global File System:簡稱“GFS”,有時也稱為“分布式文件系統”)越來越感興趣。
其實,全局文件系統并不是一個新概念。早在20世紀80年代,卡內基梅隆大學就開發了Andrew文件系統(即AFS),目前仍在使用。從那時起,商業供應商就開始將這一概念進一步推廣,并將其應用于云和內部部署存儲。
不僅僅是對象存儲
縮小內部部署和云存儲之間的差距有望簡化IT管理并降低成本。
本質上講,云存儲是分布式的。終端用戶不知道或不需要知道他們的數據存儲在哪里(除去任何基于法規約束性的限制外)。云供應商通過使用對象存儲技術實現跨多個服務器甚至多個數據中心分割數據,從而支持企業規模經濟發展需求。
但是,問題在于:大多數操作系統和應用程序無法直接讀寫對象存儲。他們希望看到NFS或SMB這樣的網絡協議,或者直接訪問或者通過SAN(Storage Area Network,存儲區域網絡)訪問存儲。盡管供應商們已經創建了存儲網關,并且提供更多的應用程序與對象存儲兼容(如Oracle和Openstack),但仍存在很多應用程序不兼容的情況。
因此,全局文件系統(GFS:Global File System)可能是目前解決上述矛盾的最佳答案,因為它能夠提供云的靈活性、彈性和容量,同時還能夠保持NAS(Network Attached Storage:網絡附屬存儲)的簡單性(至少對于應用程序和操作系統而言)。
IT產業研究機構Freeform Dynamics的首席分析師布萊恩·貝茨表示:“任何規模的大多數組織都會將數據存儲在不同的位置和文件格式,這會使查找和使用變得非常困難。”“將全局文件系統置于首位意味著,所有具有訪問權限的人都可以通過單一的標準格式看到您的所有數據;如果您愿意,可以使用虛擬化的‘超級文件系統’。”
這種方案的好處包括:基于云的規模經濟性、優于通常通過內部部署系統實現的冗余、快速添加(或刪除)存儲容量的能力,以及從資本支出轉向運營支出的支持等。
企業文件共享服務的其他優點還包括:更輕松的協作,更好的安全性,等等。
從未來發展看,公司有可能轉向一個跨本地硬件(延遲和性能至關重要)和基于云的應用程序的單一文件系統。
全局文件系統的常見功能
首先,全局文件系統通過將中央文件服務(通常在公共或私有云上)與本地網絡硬件相結合來進行緩存并確保應用程序兼容性。它們通過將所有存儲放在同一個命名空間中來實現這一目標。這可以說是,所有數據的單一“黃金”拷貝。
同時,實現上述目標需要借助緩存和同步技術以確保性能。該領域的供應商之一CTRA表示,一家大型企業可能會在每個站點移動超過30TB的數據。
其次,系統需要廣泛的兼容性。全局文件系統需要支持從傳統的本地NAS(存儲區域網絡)硬件進行遷移。操作系統和應用程序需要能夠像以前使用NFS或SMB一樣輕松地訪問全局文件系統。
最后,全局文件系統還需要確保易于使用。理想情況下,對最終用戶透明并且能夠擴展。當前的現實情況是,很少有公司能夠同時將所有內容移動到一個新的文件系統;因此,一個能夠隨著應用程序的移動而增長的全局文件系統至關重要。
全局文件系統、傳統文件系統及同步問題
作為一種基于云的服務,全局文件系統吸引了需要在站點之間共享信息的組織,或者在疫情期間經常支持的使用案例中與業務范圍以外的用戶共享信息的組織。
然而,這會導致全局文件系統的功能與傳統的文件和同步服務之間的重疊。這些服務包括更加面向消費者的服務,如Dropbox和OneDrive,這些服務通常在新冠肺炎期間被投入服務以支持遠程工作,還有SharePoint、Google Drive和企業級共享服務,等等。
一些全局文件系統供應商強調,他們也可以提供這些服務。當然,能夠在外部共享文件或者將桌面搜索擴展到基于云的文件的話,這是很有用的。然而,對于大多數企業來說,基本性能、兼容性和易遷移性方面可能更是優先考慮的因素。
Freeform Dynamics公司的Betts說:“挑戰是,這可能會導致存儲規模變得非常大。例如,您的數據是全局分布式的,您(或您的全局文件系統開發人員)需要決定如何處理文件鎖定(防止兩個人或系統同時更新同一數據)和復制等問題。”
附:全球知名全局文件系統供應商列表
克特拉(CTERA)
位于以色列的云文件服務提供商克特拉(CTERA)公司通過Edge X系列產品、緩存文件管理器、CTERA驅動器、端點設備代理和虛擬工作區VDI的組合工作。其全局文件系統支持將客戶文件鏈接到Amazon S3、Azure或IBM、HPE、Dell EMC和Scality提供的云服務。
克特拉聲稱,其緩存技術允許無限容量。此外,他們還提供來自Windows、Mac、Linux、Android和iOS的文件共享服務和設備級訪問。
納蘇尼(Nasuni)
位于美國的云存儲網關廠商Nasuni自稱為“云原生(cloud native)”存儲業務提供商,以其全局文件系統UniFS作為基礎構建塊。UniFS系統支持NAS和文件服務器整合、備份和恢復、災難恢復和協作工具。
此外,Nasuni還支持全局文件鎖定——兩個用戶不能同時寫入一個文件,并為NFS和SMB服務以及重復數據消除提供邊緣設備支持。或者,用戶可以在其虛擬或超聚合基礎架構上安裝虛擬機來代替NAS硬件。Nasuni聲稱,部署其全局文件系統的公司不再需要單獨的備份或災難恢復。
潘祖拉(Panzura)
另一家位于美國的Panzura公司將他們的戰略定位為:數據管理供應商和非結構化數據的單一平臺。他們的核心全局文件系統是CloudFS,它創建了一個經過優化的單一數據集。該公司將CloudFS描述為一個全局性的混合云文件系統。
Panzura聲稱,這不僅取代了NAS硬件,還提供了數據管理和彈性存儲。該服務還直接支持能夠直接與云端同步的移動設備。另外,該公司還提供云塊存儲服務。
錘子空間(Hammerspace)
位于美國的Hammerspace公司則專注于為客戶提供元數據的單一視圖。他們聲稱,這樣可以有效地存儲和訪問數據,甚至能夠提前預測哪些數據需要移動。
Hammerspace打出的標語是,通過其提供的全局數據環境服務實現“本地訪問全局數據”。基于此方案,可以將來自于云端、數據中心和邊緣的數據匯集到一個數據集中。然后,全局數據環境提供訪問以及輔助服務,包括數據分層、文件版本控制、重復數據消除、快照和防病毒。總之,他們的方案支持訪問云、數據中心和舊式DAS、SAN和NAS文件存儲,實現通過一個許可證涵蓋所有形式的存儲。
Peer軟件
Peer軟件公司提供的服務是具有混合和多云支持的全局文件服務,并支持邊緣和數據中心。PeerGFS僅實現為軟件層,支持主動-主動同步(active-active sync),它們使用微軟DFSN支持的全局命名空間,并支持對象存儲集成。PeerGFS還支持S3和Azure Blob。對等代理(Peer Agent)在Windows文件服務器或Windows虛擬機上運行,但用戶保留對其數據的直接訪問權限。此外,PeerGFS還支持云備份和復制。
譯者介紹
朱先忠,51CTO社區編輯,51CTO專家博客、講師,濰坊一所高校計算機教師,自由編程界老兵一枚。早期專注各種微軟技術(編著成ASP.NET AJX、Cocos 2d-X相關三本技術圖書),近十多年投身于開源世界(熟悉流行全棧Web開發技術),了解基于OneNet/AliOS+Arduino/ESP32/樹莓派等物聯網開發技術與Scala+Hadoop+Spark+Flink等大數據開發技術。
原文標題:??Global file systems: Hybrid cloud and follow-the-sun access???,作者:Stephen Pritchard?