聯(lián)泰集群水晶系列產(chǎn)品發(fā)布,震撼來(lái)襲!
北京時(shí)間2019年12月26日下午14點(diǎn)30分,聯(lián)泰集群在北京正式發(fā)布了水晶系列工作站產(chǎn)品,本次“水晶工作站產(chǎn)品發(fā)布會(huì)”暨“聯(lián)泰集群高性能計(jì)算解決方案研討會(huì)”由英特爾®中國(guó)獨(dú)家贊助,產(chǎn)品在提供強(qiáng)悍高算力的同時(shí),又能保證溫婉低噪的靜音,剛?cè)岵?jì)。
現(xiàn)場(chǎng)請(qǐng)到了英特爾中國(guó)數(shù)據(jù)中心技術(shù)售前經(jīng)理——拓慶國(guó)先生,帶來(lái)最新的英特爾CPU架構(gòu)和傲騰™技術(shù)加持的傲騰™增強(qiáng)型SSD講解,以及清華大學(xué)——張宇飛教授使用聯(lián)泰集群產(chǎn)品在科研方面的精彩案例分享。
發(fā)布會(huì)現(xiàn)場(chǎng)首先由拓總和張教授共同為水晶系列工作站揭幕,工作站產(chǎn)品在會(huì)場(chǎng)進(jìn)行了點(diǎn)亮,完全不會(huì)影響發(fā)布會(huì)的正常進(jìn)行,真正檢驗(yàn)了工作站的靜音屬性,當(dāng)?shù)弥Чぷ髡咎幱邳c(diǎn)亮狀態(tài),在場(chǎng)的嘉賓紛紛側(cè)目旁邊的展臺(tái),完全沒(méi)有察覺(jué)到如傳統(tǒng)工作站的噪音存在。
之后由聯(lián)泰集群硬件產(chǎn)品技術(shù)中心總監(jiān)——劉振鋒、軟件產(chǎn)品技術(shù)中心總監(jiān)——孫建軍、硬件產(chǎn)品技術(shù)中心工程師——肖學(xué)文分別從應(yīng)用方向、水晶工作站一體化軟件平臺(tái)及水晶系列產(chǎn)品硬件方面對(duì)本系列產(chǎn)品進(jìn)行了詳細(xì)的介紹。
入門(mén)級(jí)深度學(xué)習(xí)工作站W(wǎng)5232
在討論這個(gè)問(wèn)題之前我們需要理解為什么深度學(xué)習(xí)需要使用專(zhuān)業(yè)的工作站?
1. 深度學(xué)習(xí)需要大量的并行計(jì)算資源,而且動(dòng)輒計(jì)算幾天甚至數(shù)周,而顯卡(GPU)恰好適合這種工作,提供幾十上百倍的加速,性能強(qiáng)勁的GPU能在幾個(gè)小時(shí)內(nèi)完成原本CPU需要數(shù)月完成的任務(wù),所以目前深度學(xué)習(xí)乃至于機(jī)器學(xué)習(xí)領(lǐng)域已經(jīng)全面轉(zhuǎn)向GPU架構(gòu),使用GPU完成訓(xùn)練任務(wù)
2. 如今即使使用GPU的深度學(xué)習(xí)任務(wù)也要持續(xù)數(shù)天乃至數(shù)月(取決于數(shù)據(jù)規(guī)模和深度學(xué)習(xí)網(wǎng)絡(luò)模型),需要使用單獨(dú)的設(shè)備保障保證訓(xùn)練任務(wù)能夠7x24小時(shí)長(zhǎng)期穩(wěn)定運(yùn)行。
3. 獨(dú)立的深度學(xué)習(xí)工作站(服務(wù)器)可以方便實(shí)現(xiàn)實(shí)驗(yàn)室計(jì)算資源共享,多用戶(hù)可以在個(gè)人電腦編寫(xiě)程序,遠(yuǎn)程訪問(wèn)到深度學(xué)習(xí)服務(wù)器上排隊(duì)使用計(jì)算資源,減少購(gòu)買(mǎi)設(shè)備的開(kāi)支并且避免了在本地計(jì)算機(jī)配置復(fù)雜的軟件環(huán)境。
深度學(xué)習(xí)工作站配置要求
深度學(xué)習(xí)任務(wù)對(duì)計(jì)算機(jī)的性能要求較高,各硬件主要完成以下操作。
上述圖示,深度神經(jīng)網(wǎng)絡(luò)計(jì)算大致流程,下面通過(guò)深度神經(jīng)網(wǎng)絡(luò)計(jì)算環(huán)節(jié),分析核心硬件配置理想要求
CPU:因?yàn)橹饕褂蔑@卡進(jìn)行cuda計(jì)算,因此對(duì)CPU的要求并不是很高,頻率越高、線程數(shù)越多越好,一般最低要求cpu核心數(shù)大于顯卡個(gè)數(shù)。其中一個(gè)制約因素:cpu的最大PCI-E 通道數(shù)。每張顯卡占用16條pcie通道才能達(dá)到最大性能,而單cpu最大支持48條pcie,也就是最多3條PCI-E x16接口, 但是受限主板的大小,只有選用專(zhuān)業(yè)的工作站板子才能充分發(fā)揮GPU卡的性能,而聯(lián)泰的W5232工作站就是一個(gè)很好的選擇。采用專(zhuān)用的雙路工作站,不僅提升了CPU的處理能力,也能通過(guò)使用兩張GPU卡來(lái)增加訓(xùn)練能力。
GPU卡:深度學(xué)習(xí)需要較強(qiáng)性能的顯卡進(jìn)行復(fù)雜的單精度運(yùn)算,通常神經(jīng)網(wǎng)絡(luò)需要大量顯存和內(nèi)存資源,因此需要8GB以上顯存才能運(yùn)行大規(guī)模的深度卷積網(wǎng)絡(luò),執(zhí)行計(jì)算機(jī)視覺(jué)任務(wù),一般選擇GTX1070以上配置。應(yīng)該購(gòu)買(mǎi)具有較大顯存的顯卡。下面給出2080ti、2080、2070、1080ti、1070、1060、Titan X、Titan V的幾項(xiàng)指標(biāo)的對(duì)比:
TFLOPS(teraFLOPS FLoating-point Operations Per Second每秒浮點(diǎn)運(yùn)算次數(shù))單精度也就是運(yùn)算性能,決定了運(yùn)算速度,首選1080ti、2080ti、Titan V,不過(guò)性能最強(qiáng)的titan V的價(jià)格是2080ti的三倍
VRAM (顯存):顯存大小決定了我們的網(wǎng)絡(luò)模型能不能執(zhí)行,大型的卷積神經(jīng)網(wǎng)絡(luò)會(huì)使用超過(guò)8G以上的顯存,因此購(gòu)買(mǎi)具有大顯存的顯卡才能夠保證大多數(shù)卷積神經(jīng)網(wǎng)絡(luò)模型能夠順利執(zhí)行。聯(lián)泰的W5232工作站就是這種入門(mén)級(jí)深度學(xué)習(xí)的工作站,采用的是兩顆二代Intel至強(qiáng)可擴(kuò)展處理器,并且配備了64GB的內(nèi)存,支持2張GPU加速卡,480G的SSD作為系統(tǒng)盤(pán),4T的SATA盤(pán)作為數(shù)據(jù)盤(pán),所以整個(gè)工作站的很高的,非常適合入門(mén)級(jí)深度學(xué)習(xí)。
當(dāng)然這款工作站配置那么高,也可進(jìn)行其他的一些圖像高分辨率,高清晰度的圖像的輸出,像再醫(yī)院里面很多的各種CT等圖片都是通過(guò)這種工作站進(jìn)行掃描分辨出來(lái)的,特別是對(duì)于患者這種生理結(jié)構(gòu)圖的處理需要更加清晰的圖像,因此需要更加強(qiáng)勁的圖形處理能力。當(dāng)然對(duì)于一些醫(yī)療行業(yè)里面的關(guān)于生命科學(xué)的基本的計(jì)算工作也是可以勝任的。
今后,聯(lián)泰集群還將繼續(xù)推出更多更新的產(chǎn)品,讓我們一起感受科技前沿和創(chuàng)新變化。