阿里自研AI推理芯片問世,含光800以一當十
原創【51CTO.com原創稿件】 9月25日,達摩院院長張建鋒在杭州云棲大會現場展示了含光800AI推理芯片的流片。在業界標準的ResNet-50測試中,含光800推理性能達到78563 IPS,比目前業界優秀的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍,“含光800是阿里巴巴在芯片領域的萬里長征第一步。”
平頭哥自去年的云棲大會上宣布成立以來,在過去短短的一年里,先后發布玄鐵910、無劍SoC平臺,今天又發布了含光800芯片;這一系列新產品的推出意味著,阿里的平頭哥公司產品線已初步成型,目前已經涵蓋處理器IP、一站式芯片設計平臺和AI芯片,實現了芯片設計鏈路的全覆蓋。
含光800是什么
含光800是一款AI芯片,偏重推理。由于人工智能芯片的差異化設計主要體現在硬件架構和軟件算法上,二者需要高度適配才能發揮芯片的最大價值。從目前來看,傳統CPU、GPU在深度學習推理任務上并沒有完全發揮硬件能力,例如GPU架構主要針對圖像處理設計,其硬件結構、軟件生態幾乎固化,因此對AI任務很難有深度優化。
性能如何?
含光800的芯片架構方面,采用創新的架構,針對深度學習中使用的大量權重參數和張量數據,在支持稀疏壓縮與量化處理的基礎上,通過獨特設計的數據訪存與流水線處理技術,大大減低了I/O需求和數據的搬移。NPU同時深度優化了卷積,矩陣乘,向量計算和各種激活函數,通過高有效的硬件資源調度和全并行的數據流處理,把AI運算的性能和能效雙雙推向高峰;含光800性能的突破得益于軟硬件的協同創新。
算法方面,阿里巴巴達摩院機器智能實驗室過去兩年構建了完整的算法體系,涵蓋語音智能、語言技術、機器視覺、決策智能等方向,并且取得多個高水平的成果;硬件方面,阿里巴巴此前已在服務器、FPGA以及存儲等領域擁有多年研發經驗,此外,平頭哥技術團隊在體系結構、編譯技術等領域擁有深厚的技術儲備。
1個含光800芯片=10個GPU
含光800的數據性能表現十分突出,根據現場的keynote的數據顯示,1個含光800性能大約相當于GPU的十倍,能效比到達500IPS/W;制作工藝也采用了12nm,而晶體管數高達170億個;小編在對比了同類型的AI芯片后得出,平頭哥的這款含光800芯片在業界也是處于比較領先的位置。
含光800理論性能數據圖
實際表現
含光800目前已經被應用在阿里巴巴核心業務中。根據云棲大會的現場展示,在城市大腦中實時處理杭州主城區交通視頻,需要40顆傳統GPU,延時為300ms,而使用含光800僅需4顆,延時降至150ms。此外,大家經常使用的拍立淘產品為什么這么快,也是得益于含光800的性能;拍立淘商品庫每天新增10億商品圖片,使用傳統GPU算力識別需要1小時,而使用含光800后可縮減至5分鐘。
小編總結:
目前含光800的售價還未公布,但是相信這一高性能的芯片會是一個高性價比的產品;而平頭哥一系列芯片的發布,也意味著國產芯片的重大突破;在不久的將來,小編期待著更多的國產高性價比芯片的出現。
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】