哈佛大學(xué)云計算布局
哈佛大學(xué)已經(jīng)擁有了云計算——確切地說,是一個整體管理,高密度的IT基礎(chǔ)設(shè)施,由快速光纖鏈接交付給科研人員。通過幾年的努力,哈佛將自己的藝術(shù)與科學(xué)學(xué)院(FAS)的IT劃分成6個數(shù)據(jù)中心,而最主要的一個就位于波士頓的原Jordan Marsh大樓。如今的它是時候改變了。
這預(yù)示著管理與供應(yīng)差異化的IT基礎(chǔ)設(shè)施的來臨,哈佛下一步將徹底擺脫Boston數(shù)據(jù)中心,同其他四所大學(xué)一道步入“社區(qū)云計算”,這就是位于90英里外的麻薩諸塞州綠色高性能計算中心項目。項目會在2014年完成,這或許會是哈佛構(gòu)建的***一個數(shù)據(jù)中心,據(jù)哈佛計算中心主任兼CTO的James Cuff透露。
“如今不必再與硬件打交道了,”在藝術(shù)與科學(xué)學(xué)院(FAS)計算辦公室的一次訪談中,他談到;早前哈佛的回旋加速器實驗室已在2002年關(guān)閉。那棟建筑進行Cuff的高科技運維再合適不過了。
在他的辦公室內(nèi),碩大的監(jiān)視器被安裝在墻壁上,并與筆記本相連,通過少數(shù)命令,Cuff就可以列出活動中的計算項目和資源。他可以立刻顯示出所有東西,小到幾個CPU和少數(shù)文件存儲,大到參與當(dāng)前項目的數(shù)百TB和虛擬化服務(wù)器,這些統(tǒng)統(tǒng)通過‘所有者’(被供應(yīng)資源的對象)的ID列出。
Cuff負責(zé)這些,當(dāng)然,這不是Amazon Web Services。事實上,他管理的資源是有限的,但正因如此他才能完全控制自己的云計算。“我們時刻都有4千名的訂閱者以及將近1千個活動,”他說。
對于團隊如何控制基礎(chǔ)設(shè)施,如何針對不同類型基礎(chǔ)設(shè)施進行新模型、新技術(shù)的不斷研究,他已退居二線。他常說,任何一名會寫“類似Perl腳本”的大學(xué)生就能接管他的整個運維,這也是他最初的動機,在掌握基礎(chǔ)設(shè)施狀態(tài)問題上,要擁有敏銳的洞察力和控制力。
從IT角度來看,結(jié)果是相當(dāng)驚人的。通過哈佛藝術(shù)與科學(xué)學(xué)院(FAS)幾年來在整合方面的努力,Cuff與來自各個學(xué)科的經(jīng)營者們,不僅在計算科學(xué),管理數(shù)百臺服務(wù)器、數(shù)PB存儲、以及數(shù)千臺虛擬機,都只用花費最小的精力,就可通過一條供應(yīng)通道向所有人提供使用。Cuff說,他可以通過在折扣零售商Newegg那里訂購部件來進行運維(實際上,有不少經(jīng)銷商會給予哈佛學(xué)校折扣),他將運維丟給科研人員,甚至是在他忙著帶走他們現(xiàn)有機房的同時。
只要他們愿意,他們可以用撥款購置自己的設(shè)備,Cuff說,但在他的運維范圍內(nèi),他可以在幾分鐘內(nèi)提供他們更多的需求。相比花費數(shù)周乃至數(shù)月構(gòu)建集群,這可是很輕松的買賣。Cuff表示,云式運維的核心在于網(wǎng)絡(luò)。
對科研人員從事云計算***的障礙就是帶寬,Cuff認為。網(wǎng)格計算和超級計算一直就在我們身邊,但時至今日,你也必須利用帶寬才能觸及它們,就好比你必須坐在有電腦的屋子里。這個問題要在二元問題中找條出路,這樣Cuff才可以同時利用規(guī)模和現(xiàn)代高密度數(shù)據(jù)中心的優(yōu)勢。
答案就是一條每秒40GB鏈接Boston商業(yè)中心設(shè)備的光纖。底層屬于Macy,建筑的其余樓層才有趣。
它是Markley Group運作的數(shù)據(jù)中心,Cuff使用第七層的角落進行高密度計算,運行所有的設(shè)備,從跑在無線帶寬(InfiniBand)上的刀片服務(wù)器到576TB的SATA硬盤陣列,再到跑在每秒40GB以太網(wǎng)上的商業(yè)服務(wù)器,以及他所謂的“商業(yè)云計算”。每每游覽數(shù)據(jù)中心,Cuff都感慨到,真得很驚奇這么一個小小的地方會有多少活動發(fā)生。
“我喜歡展示恒星模擬,簡直就是我的***,”他面帶微笑地說。此時的他站在一組機架中間用手比劃著,“這就是它!整個銀河都在這里。”他所說的就是哈佛最近的一個項目,模擬銀河系的螺旋形成,該實驗需要假設(shè),計算并推導(dǎo)出數(shù)十億個恒星的時刻運動。