曙光:龍芯肯定出現(xiàn)在千萬億次HPC中
對于國產(chǎn)服務(wù)器公司曙光而言,2008年研發(fā)成功的百萬億次高性能計算機曙光5000A,使得其在國內(nèi)外HPC領(lǐng)域都取得了巨大的聲譽和成就,相關(guān)的高性能計算標(biāo)準(zhǔn)、個人HPC項目的推進(jìn),也都取得了不錯的成績,那么在2009年,曙光公司又會給業(yè)界帶來什么樣的技術(shù)呢?
記者日前采訪了曙光公司副總裁聶華,他大致描述了曙光公司的規(guī)劃,主要包括推進(jìn)刀片研發(fā)、千萬億次HPC的技術(shù)儲備、虛擬化與HPC的結(jié)合使用等方面。
“總體而言,我們對2009年的發(fā)展還是很樂觀的。”聶華表示。
推進(jìn)刀片標(biāo)準(zhǔn)
在2008年的曙光5000A中,曙光公司采用了基于AMD公司“巴塞羅那”芯片的四路四核的刀片服務(wù)器節(jié)點。聶華表示,在2009年Intel公司Nehalem芯片發(fā)布之后,曙光公司將會發(fā)布基于Nehalem芯片的四路四核刀片服務(wù)器,進(jìn)一步推動刀片服務(wù)器產(chǎn)品的升級。
此外,曙光公司作為高標(biāo)委的成員單位,將會繼續(xù)推動相關(guān)刀片服務(wù)器標(biāo)準(zhǔn)的工作。“高標(biāo)委和曙光并不是等同的,當(dāng)然作為重要的成員單位,我們也在積極地跟包括Intel公司倡導(dǎo)的SSI(模塊化服務(wù)器)標(biāo)準(zhǔn)在內(nèi)的多個標(biāo)準(zhǔn)進(jìn)行溝通,盡可能地達(dá)到兼容。”聶華表示。
他認(rèn)為,跟SSI標(biāo)準(zhǔn)之間的兼容并不是什么妥協(xié)的結(jié)果,而是盡可能地將標(biāo)準(zhǔn)進(jìn)行開放和有更大的是易用性,這樣才能夠取得更大的成功。
聶華介紹說,在2009年,曙光公司將至少單獨承擔(dān)高表委標(biāo)準(zhǔn)項目中的某一個,并且會致力于推動該項目的驗收工作。但是該標(biāo)準(zhǔn)將來的采用程度、行業(yè)標(biāo)準(zhǔn)的確立時間,就不是現(xiàn)在能夠確定的問題了。
“也許,將來標(biāo)準(zhǔn)相對成熟了,高標(biāo)委都可以考慮將這些標(biāo)準(zhǔn)提交為國際標(biāo)準(zhǔn)。”聶華說。不過他也同時表示,這些只是曙光公司的觀點,畢竟曙光無法完全代表高標(biāo)委所包括的數(shù)十家企業(yè)聯(lián)盟。
千萬億次HPC的技術(shù)儲備
在峰值為180.6萬億次的曙光5000A研發(fā)成功之后,聶華表示,針對千萬億次的高性能計算機的相關(guān)技術(shù)儲備已經(jīng)開始,不過什么時候完成千萬億次HPC的研發(fā),現(xiàn)在還很難說。
“總體而言,整個技術(shù)是連續(xù)的,并不會等到千萬億次項目真的通過審批才開始準(zhǔn)備。”聶華表示。
根據(jù)此前曙光公司總裁歷軍的觀點,通過百萬億次曙光5000A的研發(fā),他們至少已經(jīng)確認(rèn)了現(xiàn)在的研發(fā)方向是大體正確的,盡管千萬億次是一個層級上的飛躍,但是他們相信技術(shù)難度并不會很大。
“現(xiàn)在的問題是,千萬億次HPC會不會跟龍芯有一定的結(jié)合?怎么結(jié)合,有多大范圍的節(jié)點需要用到龍芯?”聶華說。根據(jù)他的觀點,在曙光5000A中當(dāng)時也是設(shè)想有部分節(jié)點使用龍芯的,但是由于龍芯目前還不太成熟,因此沒有采用。但是無論是國家的要求還是企業(yè)的技術(shù)儲備,在千萬億次的HPC中,都會有龍芯的節(jié)點。至于到底是獨立計算節(jié)點還是作為加速計算的節(jié)點,現(xiàn)在很難決定。
龍芯尚不成熟
聶華表示,現(xiàn)在龍芯還不太成熟,面臨兩大主要的挑戰(zhàn)。***就是目前龍芯的性能還有待提高。在HPC領(lǐng)域,對節(jié)點的要求相當(dāng)高,也要求很高的穩(wěn)定性。“對于龍芯來說,必須要做到四核或者八核,才能夠滿足千萬億次HPC的要求。”聶華表示。
此外,目前龍芯的相關(guān)應(yīng)用還不成熟。“我們不要求短期內(nèi)龍芯能夠有廣泛的應(yīng)用,但是從目前的角度來看,給用戶一個龍芯產(chǎn)品的話,是一個不負(fù)責(zé)任的做法。”聶華認(rèn)為。
不過他也表示,龍芯的研究屬于計算所的范圍,曙光公司只是在積極地為龍芯在服務(wù)器領(lǐng)域的應(yīng)用提供支持。
虛擬化結(jié)合HPC
Dell公司技術(shù)工程師連陳航在其博客中表示,虛擬化技術(shù)并不適合高性能計算領(lǐng)域。不過,聶華有著不同的看法。他認(rèn)為通過服務(wù)器虛擬化,可以解決一些機器資源再分配的問題,從而進(jìn)一步提高服務(wù)器的利用率問題。
“這一點,對于HPC來講,虛擬化的價值其實更大,相關(guān)的收益也更多。”聶華說。他認(rèn)為,對于HPC中的胖節(jié)點(比如說8路服務(wù)器系統(tǒng)),使用虛擬化能夠得到更高的效率,也能夠讓操作系統(tǒng)更靈活,這個就比此前的網(wǎng)格技術(shù)更為靈活。
“在此之前,在網(wǎng)格體系中的機器很難解決收費與產(chǎn)權(quán)的問題,現(xiàn)在通過虛擬機分配資源之后,通過與云計算概念的結(jié)合,使得相關(guān)的資源分配變得透明了,這就是虛擬化跟HPC結(jié)合的意義。”聶華表示,“這將對我們HPC未來的發(fā)展產(chǎn)生非常深遠(yuǎn)的影響。”
不過,在筆者看來,聶華的觀點應(yīng)該是針對曙光5000A這樣的通用HPC平臺而言的,畢竟,該平臺用于對公眾服務(wù),其節(jié)點的利用率并不一定很高;而一般的HPC平臺是用于專項研究,其節(jié)點的利用效率可能達(dá)到90%甚至以上,沒有虛擬化的需要。
保持樂觀的2009
面對2009年,聶華表示,曙光公司還是保持著樂觀的態(tài)度,畢竟HPC領(lǐng)域受到的波及相對會小一些。“從2008年的經(jīng)歷之后,我們越來越認(rèn)識到產(chǎn)品是企業(yè)發(fā)展真正的動力和源泉。”聶華說。
他表示,現(xiàn)在曙光需要做的就是盡力推動產(chǎn)品和技術(shù)研發(fā),研發(fā)有特色的產(chǎn)品,研發(fā)有差異性的產(chǎn)品。“通用型產(chǎn)品,至少不是曙光目前的策略,我們要堅持走差異化的創(chuàng)新之路,一年干不成,就兩三年乃至更多年。”聶華說。
【編輯推薦】