對話云計(jì)算的思想領(lǐng)袖:云計(jì)算在科學(xué)中的應(yīng)用
Rob Gillen在橡樹嶺國家實(shí)驗(yàn)室為政府研究云計(jì)算技術(shù)。他也參加Planet技術(shù)的研究,該技術(shù)最近推出了新的云實(shí)踐,用云計(jì)算來協(xié)助政府和公營機(jī)構(gòu)。他有一篇精彩的博客將云計(jì)算追溯到7年前,他在網(wǎng)上還有很多演講和講座。Rob也是一位Windows Azure MVP(最具價(jià)值專業(yè)人員)。
在這次采訪中,我們介紹:
基礎(chǔ)設(shè)施即服務(wù)的利弊
云計(jì)算的最大數(shù)據(jù)吞吐量
云計(jì)算在計(jì)算科學(xué)中的應(yīng)用
集裝箱計(jì)算的好處
云端架構(gòu)與非云端架構(gòu)的比較
Robert Duffner: 您能介紹一下自己嗎?
Rob Gillen: 我是一名Planet Technologies解決方案架構(gòu)師,在橡樹嶺國家實(shí)驗(yàn)室數(shù)學(xué)與計(jì)算機(jī)科學(xué) 組工作,我的工作重心是科學(xué)和技術(shù)。
Robert: 切入主題,您認(rèn)為基礎(chǔ)設(shè)施和平臺(tái)即服務(wù)的利與弊是什么?那些區(qū)別正在消失嗎?
Rob: 這個(gè)技術(shù)每個(gè)方面都有不同的優(yōu)勢。對很多人來說,作為服務(wù)的基礎(chǔ)設(shè)施平臺(tái)的方法易于上手,因?yàn)槟悻F(xiàn)有代碼的運(yùn)行基本沒有改變。那些服務(wù)或產(chǎn)品大部分沒有特定操作系統(tǒng)的要求。
隨著我們接收更多獨(dú)特的網(wǎng)絡(luò)互連等專注于技術(shù)的產(chǎn)品 ,人們能部署越來越類似于他們非云端產(chǎn)品的基于云的產(chǎn)品。
我們已經(jīng)在平臺(tái)即服務(wù)offering中看到一些有趣的東西,尤其是從低端的科學(xué)計(jì)算,在那些不是傳統(tǒng)的HPC用戶中,但可能他們已經(jīng)在本地機(jī)器上做了很多計(jì)算并非常依賴已有的本地機(jī)器。我們已經(jīng)看到一些工具被開發(fā)出來,使用平臺(tái)即服務(wù)offering本來就有的API將他們的問題和算法延伸到云端。
就區(qū)別的消失而言,我認(rèn)為特定供應(yīng)商只提供其中一個(gè)的日子很快就會(huì)結(jié)束。如果你看看一些供應(yīng)商會(huì)發(fā)現(xiàn)他們有很多跨產(chǎn)品行為。不過,我認(rèn)為在某種程度上區(qū)別將繼續(xù)存在。此外,我認(rèn)為平臺(tái)即服務(wù)offering不會(huì)很快消失。
例如,亞馬遜的彈性計(jì)算云服務(wù)是名副其實(shí)的作為服務(wù)的基礎(chǔ)設(shè)施。然而,如果你看看他們靈活的MapReduce產(chǎn)品或Beanstalk產(chǎn)品,它們都是真正的平臺(tái)即服務(wù)。
當(dāng)我們作為計(jì)算研究人員而從自己的角度比較產(chǎn)品時(shí),隨著你從基礎(chǔ)架構(gòu)產(chǎn)品開始,你有大量控制,它們來自于編程的角度和基礎(chǔ)設(shè)施的詳細(xì)信息的觀點(diǎn),但是你放棄了很多傳統(tǒng)上與云相關(guān)的“魔力”。當(dāng)你從云譜移動(dòng)到平臺(tái)即服務(wù),你放棄了一些控制,但是你獲得了很多魔力,就這種意義而言有很多事情你不用擔(dān)心。因此,鑒于你正在做的計(jì)算類型,它們對你有不同的價(jià)值。
總之,我認(rèn)為個(gè)別的技術(shù)將會(huì)繼續(xù)成長,但是在供應(yīng)商一級的區(qū)別將會(huì)隨著時(shí)間的推移慢慢消失。
Robert: 看上去,以目前的市場情況,作為服務(wù)的基礎(chǔ)設(shè)施更適合遷移現(xiàn)有的應(yīng)用程序,并且平臺(tái)即服務(wù)則是在構(gòu)建全新的基于云的應(yīng)用程序類型。您是否同意這一點(diǎn)?
Rob: 大部分情況下是這樣的。作為服務(wù)的基礎(chǔ)設(shè)施肯定是比較容易遷移的,但我想修正一下你的下半句話。我認(rèn)為,它取決于你想解決問題的類型。來自任意供應(yīng)商的平臺(tái)即服務(wù)offering通常都很有趣,但是他們有限制,并取決于你正試圖解決的問題,那些限制你或許不能接受。
所以,我同意你的觀點(diǎn),但提醒一下,不是籠統(tǒng)地說開發(fā)新項(xiàng)目的時(shí)候應(yīng)當(dāng)總是最開使就使用平臺(tái)即服務(wù)——你必須評估你想解決問題的平臺(tái)實(shí)用性。
Robert: 您已經(jīng)與著眼于云的政府機(jī)構(gòu)合作并且在貴公司推出的GovCloud 上發(fā)表博客。政府和云的其他用戶之間的關(guān)鍵區(qū)別是什么?
Rob: 最大的區(qū)別簡單地歸結(jié)為數(shù)據(jù)的隱私和數(shù)據(jù)安全。既是在政府空間的內(nèi)部也是在外部,我們和每個(gè)顧客談?wù)摰牡谝患率窃茙淼臄?shù)據(jù)安全。雖然在背后有一些好的理由,現(xiàn)實(shí)情況是云計(jì)算供應(yīng)商通常比顧客自己提供的做得要好,特別是在私營部門。對很多那樣的客戶,遷移到云給他們帶來更好的數(shù)據(jù)安全性和數(shù)據(jù)隱私。
在政府的某些地區(qū),有可能存在這種情況(尤其是在一些小的國家和地方政府辦事處)——云供應(yīng)商實(shí)際上可擁有比他們目前正在使用的更安全的平臺(tái)。但是很多時(shí)候有政策和法律的問題,這將會(huì)阻礙他們遷移到云,即使他們想要。
我認(rèn)為一些主要供應(yīng)商最近已被通過基礎(chǔ)水平或我們稱之為低安全數(shù)據(jù)的認(rèn)證,允許公共部門客戶將通??捎玫臄?shù)據(jù)放入云。但是按照政策非常敏感的數(shù)據(jù)還是不能被遷移,盡管實(shí)現(xiàn)起來還是沒有問題的。
這是今天主要考慮的一個(gè)問題,令人遺憾的是,因?yàn)槭聦?shí)上聯(lián)邦政府有很多任務(wù)受益于云計(jì)算的基礎(chǔ)設(shè)施。當(dāng)我看到打破那些障礙獲得了進(jìn)展時(shí),我很高興。當(dāng)然,其中的一些障礙不應(yīng)該也不會(huì)消失,但是有些應(yīng)該并希望它們消失。
Robert: 您寫了一系列博客帖子 關(guān)于云計(jì)算的最大吞吐量。是什么力量讓你沿著這條路走下去?有沒有這種情況,您需要將文件傳輸吞吐量最大化?
Rob: 我們認(rèn)為云計(jì)算對科學(xué)問題很有價(jià)值的方面之一是對工作或超級計(jì)算機(jī)生成的數(shù)據(jù)集的后處理或后期分析。
我們選擇了大量的Jaguar上生成的氣候數(shù)據(jù),Jaguar是橡樹嶺的一臺(tái)超級計(jì)算機(jī),我們模擬了獲取數(shù)據(jù)并將其遷移到云以備后處理的過程。我們考慮了不同的方法,在確保數(shù)據(jù)的高度完整性的同時(shí)以更快的速度獲取數(shù)據(jù)。
我們還修復(fù)了數(shù)據(jù)發(fā)布出現(xiàn)的問題,以便一旦它在云里,我們可以將它格式化使得在特定研究領(lǐng)域內(nèi)外的人都可以使用它。我們正面臨很多科學(xué)領(lǐng)域使用特定領(lǐng)域的文件格式的挑戰(zhàn)。例如,氣候?qū)W人經(jīng)常使用類似NetCDF和HDF5等文件格式。他們使用那些有特別的原因,但是它們未必廣泛使用在其他學(xué)科。同樣的數(shù)據(jù)如果繼續(xù)保持原來的格式,想使其對更多的人可用很困難。
因此,我們正在考慮如何利用云提供的平臺(tái)基礎(chǔ)設(shè)施,無論他們使用的是什么數(shù)據(jù)結(jié)構(gòu),真正注冊數(shù)據(jù)服務(wù)并使其可用于新的和比以前更廣泛的受眾是可能的。
那是我們正著手解決的主要問題,并且我們發(fā)現(xiàn)了一些有趣的結(jié)果。與一些主要的供應(yīng)商一起想出了改進(jìn)數(shù)據(jù)傳輸?shù)姆椒?。這只有當(dāng)微軟、亞馬遜公司和其他的供應(yīng)商繼續(xù)改進(jìn)他們的產(chǎn)品并使他們在科學(xué)領(lǐng)域更有吸引力的時(shí)候才會(huì)變得更好。
Robert: 數(shù)據(jù)中心是不透明的,在這個(gè)意義上說您對這個(gè)技術(shù)的實(shí)現(xiàn)沒有多大的可見性。您看到過云計(jì)算性能每天都有顯著變化的例子嗎?如果是這樣,您對應(yīng)用程序開發(fā)商的指導(dǎo)是什么?
Rob: 就使用云的角度而言,那個(gè)問題可能是和我共事的科學(xué)家們最猶豫的事情。當(dāng)面臨計(jì)算科學(xué),我們擁有最偉大及最優(yōu)秀的思想,讓他們使用這種黑盒對他們來說似乎有點(diǎn)可笑。
這就是為什么我不期望,至少是在短期內(nèi),看到云計(jì)算取代一些特別的調(diào)整硬件如Jaguar、Kracken或其它超級計(jì)算機(jī)。同時(shí),有很多科學(xué)工作對執(zhí)行時(shí)間的要求不是很高。通常,這些代碼不聰這些機(jī)器中可用的專用硬件中獲益。
有某些類型的模擬對時(shí)間很敏感且通信量大,意味著每執(zhí)行一步計(jì)算節(jié)點(diǎn)間都要進(jìn)行相對大量的通信。在這種情況下,一般的云平臺(tái)是不合適的。
很有趣地看到一些云供應(yīng)商意識到這一事實(shí)并迎合這種風(fēng)格的代碼開發(fā)平臺(tái),有亞馬遜公司和其他公司的簇計(jì)算例子作為佐證。在這些情況下很重要,這是因?yàn)橥ㄓ迷苹A(chǔ)設(shè)施可能帶來不可接受的不一致的地方。
我們還看到很多人們發(fā)表的論文評估基礎(chǔ)設(shè)施即服務(wù)供應(yīng)商,他們將看一看他們的計(jì)算能力一天天或一點(diǎn)點(diǎn)地急劇變化。大多數(shù)情況下,那被歸因?yàn)樾[的鄰居問題。當(dāng)這個(gè)研究是高校學(xué)生或是其他預(yù)算被約束的人做的小規(guī)模項(xiàng)目時(shí),他們傾向于使用任何云供應(yīng)商提供的可用的小型或中型的實(shí)例。在這種情況下,人們在相同的盒子中爭相使用資源。實(shí)際上,取決于他們的算法和他們所選擇的配置,他們有可能在相同的物理節(jié)點(diǎn)上競爭,因?yàn)樵乒?yīng)商的資源分配算法放在相同的物理節(jié)點(diǎn)上。
由于科學(xué)界的人更喜歡使用最大的可用節(jié)點(diǎn),他們更傾向于有保證地訪問物理機(jī)器。這將提高他們結(jié)果的一致性。取決于使用模式,他們?nèi)怨蚕硪胱兞浚ㄓ谰么鎯?chǔ)、網(wǎng)絡(luò)等)的有利條件,但使用使用更大的節(jié)點(diǎn)必然會(huì)減少不一致——坦率地說,那就是更符合傳統(tǒng)的高性能計(jì)算集群。當(dāng)你在群集中運(yùn)行節(jié)點(diǎn)集,你對已分配的節(jié)點(diǎn)有完全的訪問權(quán)限。
這一領(lǐng)域的核心問題是對給定問題的類型確定最適用或相應(yīng)的硬件平臺(tái)。如果是一個(gè)數(shù)據(jù)并行的應(yīng)用程序,比起執(zhí)行時(shí)間你更關(guān)心的是總有效時(shí)間或開發(fā)時(shí)間,在很多情況下云將很好地適合問題。如果你擔(dān)心滯后時(shí)間并且你有非常具體的執(zhí)行時(shí)間尺度,云(至少在其目前的典型)可能不是最適合的。
Robert: 早在去年八月,您也發(fā)了關(guān)于集裝箱計(jì)算 的帖子。您在這個(gè)趨勢下看到了什么有趣的,什么情況適合它?
Rob: 該主題與我們以前談及的一個(gè)話題結(jié)合得很好,關(guān)于聯(lián)邦空間的數(shù)據(jù)隱私。很多聯(lián)邦組織正在建立大規(guī)模數(shù)據(jù)中心。為了提高效率的關(guān)鍵一點(diǎn)是得到任何組織、政府或其他機(jī)構(gòu)來停止做無差別的繁重任務(wù)。
每個(gè)組織應(yīng)該側(cè)重它的附加值,它應(yīng)盡量允許其他人填補(bǔ)漏洞,不管是用分包、外包或其它手段。我希望將來看到更多的例子,其中數(shù)據(jù)隱私條例需要操作員,不僅是為了確保數(shù)據(jù)在某一國家的邊界內(nèi)的地理位置,還為了在我的住所、公司的環(huán)境或特定的政府機(jī)構(gòu)內(nèi)。
你可以想象一個(gè)云供應(yīng)商當(dāng)中的模型,真的在你的領(lǐng)域內(nèi)放棄數(shù)據(jù)中心的集裝箱塊,因此你有那個(gè)設(shè)備上的物理控制,即使它可能由云供應(yīng)商管理。因此,一個(gè)政府機(jī)構(gòu)不會(huì)制定自己的API或數(shù)據(jù)中心的設(shè)置及維護(hù)機(jī)制——供應(yīng)商能提供的??蛻羧钥梢允芤嬗谠频膬?nèi)在優(yōu)勢,同時(shí)維護(hù)本地硬盤上的物理控件等等。
集裝箱計(jì)算方法的另一個(gè)關(guān)鍵方面是能源效率。我們看到供應(yīng)商開始將容器看作是可替換的單元,能使他們引進(jìn)一些容器中沒有的設(shè)計(jì)。當(dāng)你不再期望能夠換出個(gè)人服務(wù)器,你可以消除傳統(tǒng)服務(wù)器底盤(為了使服務(wù)器更好地減少氣流和降低功耗),你可以鞏固電源供應(yīng)、體驗(yàn)空氣冷卻(沼澤冷卻)、更高的環(huán)境濕度……還有更多沒有列出來,并且我們看到了一些令人印象深刻的來自不同供應(yīng)商的PUE編號,我們正在努力鼓勵(lì)這些發(fā)展。
有一些有趣的模型,能夠捆綁專業(yè)的資源并在非傳統(tǒng)位置部署他們。例如你可以將產(chǎn)生器、通訊組、專門的計(jì)算資源和分析工作站,這一切都包裝在一個(gè)40尺的框中并寄給一個(gè)偏遠(yuǎn)的研究站。
Robert: 美國國家標(biāo)準(zhǔn)技術(shù)研究所 (NIST) 最近發(fā)布了云計(jì)算報(bào)告 ,引用他們的話“沒有適當(dāng)?shù)闹卫?,組織的計(jì)算基礎(chǔ)設(shè)施有可能變成雜亂、難以控制的不安全服務(wù)。”您的想法是怎樣的?
Rob: 我首先想到的是他們是正確的。
實(shí)際上,他們的這個(gè)評論類似于通常對SharePoint環(huán)境所作出的評論。任何SharePoint顧問會(huì)告訴你他們存在的最大問題是太容易得到安裝的第一個(gè)數(shù)量級,這既是該平臺(tái)的弱點(diǎn)也是它的強(qiáng)項(xiàng)。在一家大公司,你經(jīng)常聽到有人說“我們將這些SharePoint簡單地安裝配置到我們的環(huán)境中,然而他們很難從IT的角度管理和控制。我們得不到保證來確信他們做了備份或諸如此類的事情。”
我固然贊同那種情況,但是那些簡單安裝配置解決了業(yè)務(wù)問題,并且他們存在的可能原因是一些阻礙工作完成的障礙,無論是基于政策的還是基于組織的。大部分公司只是自己設(shè)置,因?yàn)檫@比走官方程序要簡單很多。
類似的情況就很容易出現(xiàn)在云計(jì)算。當(dāng)他們可以去亞馬遜公司用信用卡在短短10分鐘內(nèi)就得到他們想要的,很多人甚至不會(huì)考慮經(jīng)過幾個(gè)月的采購和政策及安全的確認(rèn)。IT機(jī)構(gòu)需要認(rèn)識到圍繞那一關(guān)系需要達(dá)到一種平衡。
我認(rèn)為隨著時(shí)間的推移,我們將致力于這樣的環(huán)境,有人能像去亞馬遜公司、微軟或找任何人那樣輕松地為云資源供給一個(gè)非云端平臺(tái)。這一模式還將提供一個(gè)簡單的手段來為其特定部署處理適當(dāng)?shù)陌踩⒁馐马?xiàng)。
我認(rèn)為有價(jià)值的地方是,在想要更多管理權(quán)的IT界人和想要更大的靈活性的用戶之間有緊張的關(guān)系。對任何組織來說,想成功使用云計(jì)算,找到適當(dāng)?shù)钠胶庵陵P(guān)重要。
Robert: 您如何看待圍繞一個(gè)組織是怎樣使用云計(jì)算而不犧牲云提供的靈活性IT正在創(chuàng)建的管理方法?
Rob: 一些云計(jì)算供應(yīng)商有使顧客事實(shí)上延伸到云的技術(shù)。如果你將那種技術(shù)與讓有組織的IT重新包裝或重新設(shè)計(jì)他們選擇的云計(jì)算供應(yīng)商提供的資源調(diào)配機(jī)制結(jié)合起來,我認(rèn)為你最后可以得到一個(gè)有趣的解決方案。
例如,我可以想象一個(gè)由我的IT機(jī)構(gòu)管理的內(nèi)部網(wǎng)站,在那里我可以看到可用計(jì)算資產(chǎn)的目錄,提供我們的內(nèi)部收費(fèi)代碼,并且有平臺(tái)裝設(shè)與我今天用外部供應(yīng)商一樣簡單。實(shí)際上,那種情況對我來說比去外部更簡單,因?yàn)槲也槐厥褂眯庞每ê蜐撛诘难a(bǔ)償機(jī)制。在該模型中,IT組織本質(zhì)上是“白色標(biāo)記了”外部供應(yīng)商的平臺(tái)和組織政策及流程,同時(shí)仍受益于大規(guī)模的公共云中。
Robert: 您認(rèn)為什么使云端的架構(gòu)不同于非云端或托管解決方案的架構(gòu)?
Rob: 該問題的答案取決于你正在使用的域。我很多云計(jì)算的同事在一般的企業(yè)環(huán)境中工作,同客戶或業(yè)務(wù),其工作目標(biāo)是云的最有效位置,例如需要大量的水平刻度的應(yīng)用程序。在這些環(huán)境中,它相對簡單地談?wù)摌?gòu)建云與不構(gòu)建云,因?yàn)榫€條清楚、出現(xiàn)固體模式。
另外,和我一起工作的很多人有至少存在十年的代碼和庫。我們?nèi)匀挥腥朔e極用Fortran 77寫程序并爭辯說它是完成這項(xiàng)工作的最佳工具。盡管大多數(shù)正在討論云的人會(huì)嘲笑這種說法,就是那種情況使得這個(gè)領(lǐng)域很獨(dú)特。
與我們一起工作的大部分研究人員不考慮構(gòu)建云與否,正如他們很少考慮如何架構(gòu)來解決他們特定的問題。這就是像我一樣的人們和組里的其他人一起需要做的,我們幫助生成讓該領(lǐng)域的科學(xué)家利用云的力量的工具,而不必一定思考或構(gòu)建它。
我最近和很多人討論到云及它應(yīng)該坐落于科學(xué)階段的哪個(gè)位置。十多年來,我一直在托管服務(wù)供應(yīng)商的地方工作,很多年來,我一直投入做托管服務(wù)的大規(guī)??s放,例如托管郵件(這現(xiàn)在被稱為“基于云的服務(wù)”)。從業(yè)務(wù)角度來看,有幾個(gè)非常有趣的方面,但是我認(rèn)為托管郵件不一定可以真正捕捉云計(jì)算的本質(zhì)。
在下一級別,你可以考慮大量集中的可用存儲(chǔ)空間或大量集中的可用虛擬機(jī),并生成有趣的平臺(tái)。這似乎是許多人正在為云計(jì)算努力的地方,在它大量增值的同時(shí),還可以從云計(jì)算得到更多的東西。
讓我對云構(gòu)建最為興奮的是,我可以建立一個(gè)算法,能夠根據(jù)所需解決問題的動(dòng)態(tài)調(diào)整環(huán)境 ,而不用建立一個(gè)算法讓它適應(yīng)一個(gè)固定的環(huán)境。這是一個(gè)有趣的轉(zhuǎn)變,同時(shí)也是另一種不同的解決問題的方法。我可以為一個(gè)科學(xué)的問題創(chuàng)建一個(gè)算法或者解決辦法,它知道需要計(jì)算些什么,當(dāng)這些需求改變的時(shí)候,它可以向外面申請獲得另外的節(jié)點(diǎn)、更多的存儲(chǔ)空間、內(nèi)存等等 。這是一場游戲轉(zhuǎn)變。
Robert: 您對著眼于遷移現(xiàn)有的應(yīng)用程序到云的組織有什么建議?
Rob: 首先,他們應(yīng)該了解,這并不像聽起來那么難。其次,他們應(yīng)該循序漸進(jìn)的來進(jìn)行這些操作。目前有多種方案和教程通過不同的模型告訴你如何實(shí)現(xiàn)。也許最好的方法就是用一個(gè)成熟的應(yīng)用程序,考慮如何在做出最少的變化的情況下將它遷移到云。一旦他們成功的在云計(jì)算中部署好之后(或多或少?zèng)]修改),他們可以考慮一下還可以對應(yīng)用程序做出什么樣的改動(dòng)來更好的利用云平臺(tái)。
很多機(jī)構(gòu)做出了錯(cuò)誤的假設(shè),他們認(rèn)為轉(zhuǎn)移到云之后,那些應(yīng)用程序就需要重新架構(gòu)。這就導(dǎo)致他們重新架構(gòu)一些關(guān)鍵的應(yīng)用程序,而這些應(yīng)用程序是他們業(yè)務(wù)的本質(zhì)依賴。在我看來,采取大量的可控增量的步驟比采取少量的大步驟要好。
Robert: 那似乎是把它包起來的一個(gè)很好的地方。感謝您的時(shí)間。
Rob: 別客氣。