起底華為計(jì)算戰(zhàn)略:十五年研發(fā)下苦功,三年連發(fā)10芯加速
本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
每一次華為新動(dòng)作,點(diǎn)贊有之,質(zhì)疑亦隨之。
9月18日剛在全聯(lián)接大會(huì)上發(fā)布的“全球最快AI產(chǎn)品”就是這樣。
但在現(xiàn)場(chǎng)、在華為內(nèi)部來(lái)看,這只不過(guò)是“華為計(jì)算戰(zhàn)略”艱苦奮斗的開(kāi)花結(jié)果,只是這盤芯片和計(jì)算力大棋局里關(guān)鍵一子。
△ 華為Cloud & AI產(chǎn)品與服務(wù)總裁侯金龍
而且相比Atlas(古希臘神話里的“大力神”),實(shí)際不到三年時(shí)間里,華為已經(jīng)發(fā)布了10款商用芯片:
鯤鵬916、920;麒麟970、980、810、990、990 5G;昇騰310、910;鴻鵠818。
按外泄的規(guī)劃,接下來(lái)的兩年內(nèi),至少有6款芯片發(fā)布落地。
無(wú)論是計(jì)算領(lǐng)域,還是半導(dǎo)體行業(yè),如此陣仗,勢(shì)頭都異常猛烈。
所以背后原因究竟是什么?華為又究竟想做什么?
計(jì)算戰(zhàn)略發(fā)布后,是時(shí)候?qū)@盤大棋來(lái)次完整起底,揭秘華為在計(jì)算背后的種種規(guī)劃與布局。
15年苦功夫,目前投入2萬(wàn)名工程師
圍繞計(jì)算這個(gè)產(chǎn)業(yè)投資,十幾年前已經(jīng)開(kāi)始了。
其中最具標(biāo)志性的事件是2004年4月,旗下芯片公司海思半導(dǎo)體成立。
華為Cloud & AI產(chǎn)品與服務(wù)總裁侯金龍透露了這背后的投入:
從2004年開(kāi)始投資研發(fā)第一顆嵌入式處理芯片,目前投入超過(guò)2萬(wàn)名工程師,形成了以“鯤鵬+昇騰”為核心的基礎(chǔ)芯片族。

基礎(chǔ)芯片族帶來(lái)的意義非常直接。華為成為了業(yè)界唯一同時(shí)擁有計(jì)算架構(gòu)中“CPU,NPU,存儲(chǔ)控制,網(wǎng)絡(luò)互連,智能管理”5大關(guān)鍵芯片的廠商。
但俱往矣。
從產(chǎn)品發(fā)布的節(jié)奏來(lái)看,華為對(duì)芯片投資的力度還在快速加強(qiáng),迭代也越來(lái)越快。
華為投資芯片的策略,此前也有曝光,總結(jié)起來(lái)就是三個(gè)關(guān)鍵詞:量產(chǎn)一代、研發(fā)一代、規(guī)劃一代。

以鯤鵬系列處理器為例,從2007年走到現(xiàn)在已歷時(shí)12年,現(xiàn)在是第三代芯片。
現(xiàn)在華為釋放出的最新信號(hào)是:鯤鵬+昇騰會(huì)長(zhǎng)期演進(jìn),按照每年推出一代的節(jié)奏來(lái)提升競(jìng)爭(zhēng)力。
這也是華為在不到3年內(nèi)推出10款芯片的直接推動(dòng)力量之一。
當(dāng)然,上述種種努力和產(chǎn)品,只是果,細(xì)究“因”,則是華為對(duì)于行業(yè)變遷趨勢(shì)的核心判斷。
華為芯的機(jī)會(huì):趨勢(shì)變遷下的2萬(wàn)億市場(chǎng)
在華為看來(lái),當(dāng)前的計(jì)算產(chǎn)業(yè)正在發(fā)生深刻的變化,尤其是整個(gè)社會(huì)向智能時(shí)代的邁進(jìn),這帶來(lái)了變革與挑戰(zhàn),也帶來(lái)了機(jī)會(huì)。
全聯(lián)接大會(huì)上,胡厚崑援引了Gartner的數(shù)據(jù)——全球計(jì)算產(chǎn)業(yè)總空間為兩萬(wàn)億美元。在他看來(lái),這是一片大藍(lán)海,華為將堅(jiān)定在計(jì)算領(lǐng)域的投入,并推進(jìn)落地。
侯金龍進(jìn)一步闡釋四大趨勢(shì),也可以說(shuō)是華為投資芯片進(jìn)入這一藍(lán)海的主要切入點(diǎn):
首先,數(shù)據(jù)中心不夠用了
對(duì)于數(shù)據(jù)中心來(lái)說(shuō),以前其承擔(dān)的職能更多的是存、但未來(lái)更重要的是算,數(shù)據(jù)中心正在逐步演變?yōu)橛?jì)算中心。
最直接的體現(xiàn)就是,大規(guī)模數(shù)據(jù)中心中服務(wù)器越來(lái)越多。就以華為云的數(shù)據(jù)中心為例,有60%都是用于計(jì)算的服務(wù)器。
可以說(shuō),計(jì)算正在成為數(shù)據(jù)中心的主體,這就是華為推動(dòng)鯤鵬系列芯片的重要原因之一,也是鯤鵬芯片的使用場(chǎng)景。
與此同時(shí),整個(gè)行業(yè)對(duì)AI算力需求也越來(lái)越大,而且來(lái)得更加洶涌,從2012年到2018年,AI算力消耗幾乎增長(zhǎng)了30萬(wàn)倍。

現(xiàn)在每年的增長(zhǎng)超過(guò)10倍,到2025年,AI算力將會(huì)占據(jù)數(shù)據(jù)中心算力的80%以上。
正是在如此算力需求下,華為推出了昇騰910以及Altas 900等AI計(jì)算產(chǎn)品。
其次,端邊芯片與中心芯片還有大差距
在華為看來(lái),Arm在生態(tài)上的優(yōu)勢(shì)會(huì)逐漸向數(shù)據(jù)中心延伸。對(duì)于華為來(lái)說(shuō),這是挑戰(zhàn),也是機(jī)會(huì)。
現(xiàn)場(chǎng),侯金龍也分享了一組數(shù)據(jù):
2018年,Arm處理器出貨量230億片,主要用于端和邊,數(shù)據(jù)中心側(cè)只有3000萬(wàn)片,這是數(shù)百倍的差距。
每年十幾億部手機(jī)都是Arm結(jié)構(gòu)的,2019年華為智能手機(jī)總的算力,將是今年全球數(shù)據(jù)中心新增算力的2倍,而且手機(jī)上的幾百萬(wàn)應(yīng)用都是基于Arm生態(tài)。

以前基于Arm的技術(shù),之所以不能在數(shù)據(jù)中心使用,核心的限制是性能。
但解決問(wèn)題導(dǎo)向,華為現(xiàn)已找到對(duì)策。
其今年發(fā)布的鯤鵬920是兼容Arm,多核、高并發(fā),把四顆核心并入了一顆核心,其性能超過(guò)業(yè)內(nèi)通用CPU 20%的性能。
而且現(xiàn)在的計(jì)算,可以讓簡(jiǎn)單的計(jì)算在終端進(jìn)行,復(fù)雜的計(jì)算可以在云上進(jìn)。
如果繼續(xù)用X86架構(gòu)在云上計(jì)算終端的任務(wù),效率就會(huì)降低40%,反之如果運(yùn)用Arm架構(gòu),則提升40%。
第三,計(jì)算該綠
高性能的計(jì)算雖然更有效率,但背后也有大量的碳排放。
美國(guó)馬薩諸塞大學(xué)阿姆赫斯特分校做過(guò)研究,訓(xùn)練一個(gè)單一AI模型,會(huì)產(chǎn)生180噸的碳排放。
這相當(dāng)于普通汽車整個(gè)服役期排放量的3倍,平均地球人30年日常生活的碳排放。

算力與效率背后,也需要對(duì)能源與環(huán)境更友好。從芯片層面上來(lái)看,要在更小的功耗下實(shí)現(xiàn)更高的性能。
在這方面,華為的底氣很足。
侯金龍說(shuō),華為的Atlas 900 AI訓(xùn)練集群,算力達(dá)到256 PFLOPS只需要16個(gè)機(jī)柜。
要實(shí)現(xiàn)這樣的算力,如果用CPU需要6195個(gè)機(jī)柜, 用GPU需要208個(gè)機(jī)柜,而NPU如昇騰只要128個(gè)機(jī)柜。
這背后,主要?dú)w功于昇騰架構(gòu)對(duì)深度學(xué)習(xí)業(yè)務(wù)的優(yōu)化。
此外,經(jīng)過(guò)華為系統(tǒng)級(jí)優(yōu)化,如板級(jí)液冷、柜級(jí)密閉絕熱等,整個(gè)集群的功耗從4萬(wàn)kW降到736kW,降低50多倍。
最后,摩爾定律放緩已成事實(shí)
經(jīng)過(guò)數(shù)十年的快速迭代發(fā)展,高速的摩爾定律已經(jīng)難以實(shí)現(xiàn)。
過(guò)去5年,通用CPU的發(fā)展遇到了許多技術(shù)瓶頸,單核性能平均每年提升不足10%,摩爾定律放緩已經(jīng)成為事實(shí)。
想要進(jìn)一步實(shí)現(xiàn)提高技術(shù)能力,在晶體管上打主意太難了,需要尋找其他路徑。
這也是華為將基礎(chǔ)研究作為整體計(jì)算戰(zhàn)略關(guān)鍵組成部分的原因,最具代表性的成果,就是華為自研的達(dá)芬奇架構(gòu)。
未來(lái),華為的目標(biāo)是通過(guò)一系列的技術(shù)創(chuàng)新,打破能效墻、打破散熱墻、打破優(yōu)化墻、 打破內(nèi)存墻、打破高速IO墻,進(jìn)一步釋放計(jì)算潛能。
總之,在華為看來(lái),計(jì)算產(chǎn)業(yè)已進(jìn)入架構(gòu)創(chuàng)新的黃金時(shí)代,充裕、高性能、多樣性、綠色、觸手可及的算力將是智能社會(huì)發(fā)展的動(dòng)力。
這需要更高性能的芯片做支撐,但僅僅依靠芯片還不夠。
在整個(gè)華為計(jì)算戰(zhàn)略中,芯片只是一部分。
解讀華為計(jì)算戰(zhàn)略:硬件開(kāi)放與軟件開(kāi)源
整體來(lái)看,華為計(jì)算圖景可以歸為“一云兩翼雙引擎+開(kāi)放的生態(tài)”。

其中一云,是華為云。
這是華為計(jì)算的核心輸出途徑——芯片不直接對(duì)外銷售,以云服務(wù)和部件的形式面向客戶,優(yōu)先支持合作伙伴發(fā)展整機(jī)。
雙引擎是指“鯤鵬”與“昇騰”。基于此打造芯片簇,構(gòu)筑異構(gòu)的計(jì)算,是華為計(jì)算戰(zhàn)略的基礎(chǔ)也是主要?jiǎng)恿?lái)源。

兩翼則是智能計(jì)算業(yè)務(wù)、智能數(shù)據(jù)與存儲(chǔ)業(yè)務(wù),是計(jì)算的商業(yè)模式和直接應(yīng)用場(chǎng)景。
開(kāi)放的生態(tài),則是整個(gè)華為計(jì)算戰(zhàn)略的“點(diǎn)睛之筆”,也是今年華為全聯(lián)接大會(huì)的重頭戲。
這一方面,主要分為硬件開(kāi)放和軟件開(kāi)源兩大部分,目標(biāo)是使能廣大的合作伙伴, 形成一個(gè)開(kāi)放的產(chǎn)業(yè)生態(tài)。

硬件開(kāi)放
如何落地?具體到商業(yè)模式上,是基于芯片等對(duì)外提供主板/SSD/網(wǎng)卡/RAID卡/Atlas模組和板卡,優(yōu)先支持合作伙伴發(fā)展服務(wù)器和PC等計(jì)算產(chǎn)品,以及自己的品牌。
華為也在全聯(lián)接大會(huì)上表示,其TaiShan服務(wù)器以及華為終端的PC機(jī),聚焦做高端和內(nèi)部配套,條件成熟時(shí),將停止TaiShan服務(wù)器的銷售業(yè)務(wù)。
在全聯(lián)接大會(huì)上,除了Altas,華為也發(fā)布了以下硬件新品:
鯤鵬主板,用于快速開(kāi)發(fā)服務(wù)器和臺(tái)式機(jī)產(chǎn)品。采用 xPU高速互聯(lián)、多合一SoC、100GE高速I/O等關(guān)鍵技術(shù),不僅搭載鯤鵬處理器,還內(nèi)置BMC芯片、BIOS軟件。與此同時(shí),華為也將開(kāi)放主板接口規(guī)范和設(shè)備管理規(guī)范。

通用服務(wù)器TaiShan系列 ,號(hào)稱“最強(qiáng)算力”的通用服務(wù)器。具備至少64核、8個(gè)內(nèi)存通道、PCIe 4.0、多合一SoC、xPU高速互聯(lián)、100GE高速I/O等六個(gè)特征。
而且,面向數(shù)據(jù)中心分布式演進(jìn)需求以及邊緣計(jì)算需求,華為還提供了存儲(chǔ)密集型、計(jì)算密集型、邊緣計(jì)算等多款服務(wù)器產(chǎn)品。
Atlas全系列產(chǎn)品,覆蓋云、邊、端全場(chǎng)景,面向訓(xùn)練和推理提供強(qiáng)勁算力。主要基于昇騰910和310 AI處理器,華為推出Atlas 900、AI訓(xùn)練服務(wù)器 Atlas 800、和AI訓(xùn)練卡Atlas 300。

其中,Atlas 800在4U空間集成了8顆昇騰910 AI處理器,可提供2 PFLOPS的超強(qiáng)算力,算力密度是業(yè)界同類產(chǎn)品的2.5倍,內(nèi)置32個(gè)硬件解碼器,每秒可完成16384張1080P圖片解碼,可以與訓(xùn)練并行處理。
△8個(gè)Atlas 800組成的機(jī)柜,內(nèi)置64顆昇騰910芯片,Atlas 900訓(xùn)練集群最少由16個(gè)機(jī)柜組成。
Atlas 300可提供256 TFLOPS的算力,是當(dāng)前業(yè)界主流訓(xùn)練卡的2倍,每秒訓(xùn)練的圖片數(shù)量從965張?zhí)嵘?802張。可實(shí)現(xiàn)梯度參數(shù)和數(shù)據(jù)集并行傳輸,最高可降低70%的梯度同步時(shí)延。
此外,華為也發(fā)布了112款基于鯤鵬和昇騰的云服務(wù),包括69款基于鯤 鵬的云服務(wù)和43款基于昇騰的云服務(wù),讓客戶和合作伙伴們能 更容易的獲取鯤鵬和昇騰的算力。

華為介紹稱,基于昇騰的圖像搜索服務(wù)、內(nèi)容審核服務(wù),價(jià)格下調(diào)70%。
軟件開(kāi)源
軟件開(kāi)源,與硬件開(kāi)放相伴而生,是開(kāi)放硬件能力的放大器。
繼8月23日華為宣布開(kāi)源AI計(jì)算框架MindSpore、8月31日放出方舟編譯器框架代碼之后,全聯(lián)接大會(huì)上華為又放出多個(gè)軟件開(kāi)源計(jì)劃:
2019年12月31日開(kāi)源服務(wù)器操作系統(tǒng),2020年6月開(kāi)源可覆蓋企業(yè)70%以上的數(shù)據(jù)庫(kù)業(yè)務(wù)場(chǎng)景的GaussDB OLTP單機(jī)版數(shù)據(jù)庫(kù)。

之后,華為將支持基于 openEuler的合作伙伴發(fā)行商業(yè)版操作系統(tǒng),支持各行業(yè)主流應(yīng)用和軟件開(kāi)發(fā)商把軟件和應(yīng)用遷移到基于openEuler的操作系統(tǒng) 上。
而且,華為也將與深之度、中標(biāo)麒麟、天津麒麟、中移蘇研、普華等伙伴計(jì)劃聯(lián)合推出openEuler開(kāi)源社區(qū) (http://openEuler.org)。
怎么理解華為有所為,有所不為?
伴隨著華為計(jì)算戰(zhàn)略的披露,“華為有所為,有所不為”也屢次被擺到臺(tái)面上。
到底怎么理解華為有所為,有所不為?
侯金龍也進(jìn)一步給出了解釋,華為的聚焦點(diǎn)是重點(diǎn)投資計(jì)算架構(gòu)創(chuàng)新,處理器的研發(fā),以及華為云。
在這之外,華為不做應(yīng)用,但免費(fèi)支持主流應(yīng)用和軟件的遷移。
更能體現(xiàn)這一態(tài)度的是華為對(duì)開(kāi)發(fā)者的支持。
侯金龍表示,開(kāi)發(fā)者是產(chǎn)業(yè)的靈魂,未來(lái)5年培養(yǎng)500萬(wàn)開(kāi)發(fā)者,將投入15 億美金用于發(fā)展產(chǎn)業(yè)生態(tài)。
那么,華為到底想要做什么?
胡厚崑也在采訪中給出了答案:面向智能時(shí)代,華為想要做的是成為數(shù)字世界的“底座”。
如此愿景,你怎么看?