多云還是單云?五角大樓要用100億美金定義企業云未來
2019 年***季度,將要在全球云產業,發生一件定義未來的大事件,這就是美國五角大樓的 JEDI 大單到底花落誰家。2018 年 3 月,美國國防部發布了一份價值 100 億美元的聯合企業防御基礎設施(Joint Enterprise Defense Infrastructure, JEDI)的商業云采購合同。這份十年期的云服務合同,將把整個美國國防部向 IaaS 和 PaaS 云平臺遷移。而 JEDI 招標說明中指定只向一家云供應商采購,而不是業界熱炒的多云方案。
JEDI 隨后鎖定 AWS,但也一石激起千層浪,導致其它幾大公有云服務商中,有的甚至起訴至聯邦法院。美國國防部發言人 Heather Babb 在后期接受媒體采訪時強調,單一云供應商方案能改進安全性、提高數據可獲得性以及簡化對云服務的采用和使用。JEDI 云只選擇一家單一云服務商的策略,確實讓整個云產業大感意外。而 AWS 則與 JEDI 有著一樣的思路,AWS CEO Andy Jassy 早在 2016 年就喊出“采用多個云服務商的做法不可取”的觀點。
整個 2018 年,多家公有云服務相繼出現了宕機事件,JEDI 的 100 億美元大單則挑戰整個業界對于多云的觀點。那么,進入云計算的新十年,到底企業應該采用多云策略還是單云策略?隨著 JEDI 招標書規定的最終簽訂合同期限臨近,多云與單云之爭注定要愈演愈烈。
多云還是單云,這是一個問題
自從出現云計算以來,多云似乎就是一個產業和客戶共同的論調。IDC《2018 全球 IT 行業預測》顯示,2020 年,超過 90% 的企業將會使用多種云服務和云平臺,超過1/3 的機構將會建立多云管理機制。同時,Gartner 指出目前企業數據中心***的挑戰是如何制定多云策略。
那么,企業為什么要選擇多云策略呢?
選擇多云戰略的***個重要原因是成本管理。普遍來說,企業相信通過選擇不同的云服務組合可以降低總體成本。但實際上用戶低估了云費用的浪費,RightScale 的 2019 年全球云狀況報告的受訪者估計浪費了 27%,而 RightScale 實際浪費測量為 35%。云費用的浪費在很大程度上,是因為企業對于多云的信念而采購了多余的云實例,從而出現了云蔓延的現象。
選擇多云戰略的第二個重要原因是避免云鎖定和靈活性。但 Forbes 網站也在 2018 年 6 月的時候發表了由 MapR 公司 CTO Tom Fisher 所撰寫《多云——每個人都在談論它,但誰在做呢?》文章,專門談到云鎖定的問題。MapR 公司是全球三大 Hadoop 開源大數據分析技術供應商之一。Tom Fisher 在文章中指出,多云框架面臨許多挑戰。例如,沒有辦法讓 Redshift(亞馬遜 Aurora 項目)在 Google Cloud 或 Microsoft Azure 上運行,這是技術設計本身所導致的;類似地,Bigtable 依賴于底層的谷歌文件系統 GFS,因此對于嘗試在 AWS 或 Azure 上運行它并不是一個有吸引力的選擇。
選擇多云戰略還有一個重要的現實原因是容災和備份。選擇多云策略進行數據備份與恢復,可以確保在一個云上的數據和備份全部被誤刪后,另一個云的數據和備份仍在。廠商這么做基本出于“云服務商也不是神”的考慮,哪怕承諾多少個 9 的 SLA 服務水平承諾,也可能會出現宕機,這一點從幾乎所有公有云服務商都出現過宕機事件就可以看出。但事實上,單云服務商也可以提供成熟的異地雙活、異地多活、數據三備份等技術,可保證數據的安全和可靠,只要策略得當,也能保證數據的高可靠和高可用。
值得一聽的聲音:單云也是足夠好的
由于我們才進行云計算的第二個十年,而在***個十年主要處于發展云計算技術的階段,真正到應用多云或單云環境于成熟的生產業務中,才剛剛開始。因此,到底是多云真的占優,還是單云也有其強項?
Tom Fisher 曾在其文章中分析:仍有很多炒作是關于多云能夠跨多個云運行公共工作負載的能力,能實現這一承諾的客戶或技術人員并沒有太多的文檔證據。AWS CEO Andy Jassy 則表示,很多機構都在“開始想怎么將業務分別放到不同的云里。當他們經過深入研究后,絕大多數人最終不會選擇多個云。他們主要還是使用單一供應商。”
在 2011 年的時候,美國國防部就有 1 萬余個運營中的 IT 系統,其中 20% 為關鍵任務系統,還有超過 772 個數據中心、1.5 萬個網絡、近 7 萬臺服務器以及超過 700 萬臺電腦和 IT 設備,IT 人員高達 17 萬人。
早在 2011 年美國國防部在制訂 IT 戰略和規劃的時候,就指出美國國防部的 IT 基礎設施必須要簡化到一個整體集成和可互操作的資源,以快速把正確的信息在正確的時間交付到正確的地點,無論全球的任何地方。
對于美國國防部來說,單一云服務供應商的***好處是安全。在任何類型的云環境中,安全性是技術提供者和客戶組織之間的共同責任。在單云環境中,這種劃分比在多云環境中更容易實現。此外,單一云服務供應商可以更容易、更全面地滿足美國國防部在全球各地的安全和身體管理需求,以及整體安全策略的規劃、制訂、實施和更新。
單一云服務供應商的第二大好處是簡化接口、標準和管理。對于美國國防部這樣一個龐大的組織而言,各種機構林立。單一云服務商則可以與各個分支機構對接,更容易在總部和分支機構之間建立整體的接口、標準和管理流程。
Andy Jassy 強調,如果企業想走多云之路,最基本的是要實現***層的標準化,但是現實是不同的云平臺都不一樣。比如,系統的速度對于美國國防部來說很重要,單一云服務商的技術優化顯然要比多個云服務之間的聯合優化要容易的多。
而在大家都關心的容災和備份方面,單一云服務商也有著重大的好處。因為如何采用多云的容災方案,就必須要面臨不同云服務商的不同管理門戶和基于不同知識的服務。對于 IaaS 而言,不同云服務商對于 VM 都采用不同的磁盤格式,例如 Azure 使用 VHD 格式而 AWS 使用 AMI 格式。通常來說,每一家云服務商的容災服務都不是為多云環境而設計的。反過來,與單一云服務商合作,更容易設計和滿足美國國防部這樣超大型組織的各種容災需求。而對技術不那么成熟、體量更小的企業來說,毫無疑問,單云是更優選擇。
在國內也有類似觀點。上海駐云信息科技有限公司創始人蔣爍淼在談到容災和備份時,認為多云是趨勢,但多云在可靠性方面比較麻煩,多云可靠的前提是有強大的技術團隊保證各個云之間的有序管理,而不僅是將各個云的管理界面統一。如果團隊沒有很強的技術能力,那么在一朵云上實現多可用區多 Region 的備份更為可靠。限制多云可靠性的本質在于網絡,因為不同云處于不同的 VPC 以及 VPC 之上的云運營商內網里。容器雖然能實現自動漂移,但如果兩多云之間網絡可靠性和技術團隊實力不行,就會導致一端出問題、另一端也宕機的情況。
總體來說,在 2019 年開始之際,也是云計算進入第 13 個年頭,企業對于云計算的實踐進入實質性應用階段。在這個階段,到底是采用多云策略還是單云策略,已經不是技術哲學層面上的探討,而是將影響企業未來數字化轉型的關鍵性決策。JEDI 的 100 億美元大單到底花落多家還是一家,這將影響云計算產業,特別是企業云市場今后的走勢。