OpenAI都想入局的GPU,究竟是個(gè)啥?
隨著ChatGPT等大型語(yǔ)言模型掀起新一輪AI變革浪潮,AI芯片短缺問(wèn)題日益嚴(yán)重。例如,ChatGPT開(kāi)發(fā)商O(píng)penAI高度依賴(lài)微軟提供的超級(jí)計(jì)算機(jī),使用了大量的英偉達(dá)GPU。近日有消息稱(chēng),OpenAI正在考慮自己制造或收購(gòu)AI芯片,以解決其業(yè)務(wù)所需的高性能和低成本GPU的問(wèn)題。
今天,咱們來(lái)聊聊,OpenAI都想入局的GPU,究竟是個(gè)啥?
GPU是什么
“一千款手機(jī),就有一千種游戲體驗(yàn)”,當(dāng)我們用不同的手機(jī)玩游戲時(shí),體驗(yàn)感是不同的,除了響應(yīng)速度,游戲畫(huà)面的精美度和立體度也是一個(gè)主要差異,造成這種差異的因素之一是手機(jī)GPU的性能不同。
GPU(Graphics Processing Unit,圖形處理器),作為一個(gè)隱藏在手機(jī)和電腦中的超能英雄,不僅是一個(gè)專(zhuān)業(yè)的畫(huà)家,能快速繪制出色彩繽紛的畫(huà)面,還是一個(gè)數(shù)學(xué)家,能快速完成大量的計(jì)算任務(wù)。
專(zhuān)業(yè)地說(shuō),GPU是一種專(zhuān)門(mén)用于處理圖形的處理器,它能夠以非??斓乃俣忍幚泶罅康膱D形渲染計(jì)算,而且可以同時(shí)處理多個(gè)圖形任務(wù),從而大大提高計(jì)算機(jī)的計(jì)算和處理速度。
圖片
GPU最初是為圖形處理而設(shè)計(jì)的,但由于其并行處理和高速計(jì)算能力,GPU開(kāi)始擔(dān)任更多、更重要的角色?,F(xiàn)在GPU被廣泛應(yīng)用于科學(xué)計(jì)算、機(jī)器學(xué)習(xí)、大數(shù)據(jù)分析等領(lǐng)域。
計(jì)算機(jī)中的GPU可以分為兩種,集成GPU和獨(dú)立GPU。
- 集成GPU,體積較小,一般內(nèi)置在計(jì)算機(jī)主板中,甚至可以集成到CPU中。集成GPU可以使計(jì)算機(jī)更輕巧,常見(jiàn)于筆記本電腦中。
- 獨(dú)立GPU,體積較大,是一個(gè)獨(dú)立的部件,在電腦主板上有專(zhuān)門(mén)的插口。其功能比集成GPU更強(qiáng)大,而且可以單獨(dú)升級(jí)(更換顯卡)。但是由于體積較大,會(huì)占用電腦更大的空間,且運(yùn)行時(shí)消耗更多能源并產(chǎn)生更多熱量。
有的筆記本電腦同時(shí)具有這兩種GPU,一般情況下使用集成GPU節(jié)省能源減少發(fā)熱,當(dāng)需要更強(qiáng)大的圖形處理性能時(shí),切換到獨(dú)立GPU執(zhí)行相關(guān)的任務(wù)。
GPU和CPU有哪些區(qū)別
看到這里,你是不是想到計(jì)算機(jī)中另一個(gè)重要角色CPU(Central Processing Unit,中央處理器),那么,GPU和CPU有什么區(qū)別呢?
雖然二者都能執(zhí)行計(jì)算任務(wù),但能力各有千秋。如果說(shuō)CPU是一個(gè)知識(shí)淵博的數(shù)學(xué)教授,什么題目都會(huì)解,那么GPU就是一萬(wàn)個(gè)小學(xué)生,人多力量大,在計(jì)算簡(jiǎn)單數(shù)學(xué)題時(shí),速度極快。
圖片
事實(shí)上,在GPU出現(xiàn)之前,基本上所有的任務(wù)都是由CPU完成的。有了GPU之后,二者才進(jìn)行了分工,下表列出了二者的區(qū)別。
圖片
圖片
通過(guò)以上對(duì)比,我們發(fā)現(xiàn),GPU和CPU各有所長(zhǎng)。在手機(jī)和電腦中,二者相互配合,分工合作,共同為我們服務(wù)。
GPU更適合AI
通過(guò)前面的介紹,我們了解到GPU非常適合大規(guī)模并行計(jì)算。AI(Artificial Intelligence,人工智能)的訓(xùn)練剛好涉及大量的數(shù)據(jù)處理,特別是在深度學(xué)習(xí)領(lǐng)域,網(wǎng)絡(luò)模型通常有數(shù)百萬(wàn)甚至數(shù)十億的參數(shù),需要通過(guò)大量的數(shù)據(jù)來(lái)進(jìn)行訓(xùn)練,以獲得準(zhǔn)確的預(yù)測(cè),因此GPU非常適合AI算法。
圖片
并行處理能力
GPU具有大量的核心和高速內(nèi)存,擅長(zhǎng)并行計(jì)算。在AI領(lǐng)域,計(jì)算量非常龐大,而GPU剛好適合這種場(chǎng)景。好比需要計(jì)算大量的簡(jiǎn)單數(shù)學(xué)題時(shí),一萬(wàn)名小學(xué)生肯定比一名教授更適合。
內(nèi)存帶寬更大
一些常見(jiàn)的GPU內(nèi)存帶寬約為400 GB/s,而最好的CPU內(nèi)存帶寬大約為50 GB/s,所以GPU可以更快地獲取和訪(fǎng)問(wèn)內(nèi)存中的數(shù)據(jù)。在AI領(lǐng)域,數(shù)據(jù)一般占用大塊連續(xù)的內(nèi)存空間,顯然GPU更合適。
靈活性強(qiáng)
GPU支持使用CUDA、OpenCL等編程框架和語(yǔ)言,使得開(kāi)發(fā)人員能夠輕松利用GPU的計(jì)算能力,高度自定義GPU的計(jì)算任務(wù),為不同類(lèi)型的AI算法提供支持。
CUDA
Compute Unified Device Architecture,統(tǒng)一計(jì)算設(shè)備架構(gòu),一種由NVIDIA推出的通用并行計(jì)算架構(gòu),該架構(gòu)使GPU能夠解決復(fù)雜的計(jì)算問(wèn)題。
OpenCL
Open Computing Language,開(kāi)放設(shè)計(jì)語(yǔ)言,是一種開(kāi)放的標(biāo)準(zhǔn),用于超級(jí)計(jì)算機(jī)、云服務(wù)器、個(gè)人計(jì)算機(jī)、移動(dòng)設(shè)備和嵌入式平臺(tái)中各種加速器的跨平臺(tái)并行編程。
擴(kuò)展性強(qiáng)
隨著AI模型的復(fù)雜度增加和數(shù)據(jù)量的增長(zhǎng),我們可以通過(guò)增加更多的GPU來(lái)提高處理能力,就像是增加更多的小學(xué)生來(lái)進(jìn)行計(jì)算,使得系統(tǒng)能夠更好地應(yīng)對(duì)不斷增長(zhǎng)的計(jì)算需求。
結(jié)束語(yǔ)
近日,中興通訊專(zhuān)為大規(guī)模模型訓(xùn)練而設(shè)計(jì)的旗艦GPU服務(wù)器R6900 G5亮相中國(guó)移動(dòng)全球合作伙伴大會(huì),以卓越的計(jì)算性能、高速網(wǎng)絡(luò)通信能力以及創(chuàng)新的能效表現(xiàn)為人工智能和深度學(xué)習(xí)等領(lǐng)域帶來(lái)全新的突破。