自動駕駛熱潮引燃AI芯片大戰,爆點不止特斯拉一家
之前被炒的沸沸揚揚、多次被媒體尋找蛛絲馬跡來證明真實性的“特斯拉自研AI芯片”傳聞,這個月初被馬斯克親自敲了實錘。在今年12月初的神經信息處理系統大會NIPS上,馬斯克承認,特斯拉自動駕駛硬件工程副總裁JimKeller正在領導AI芯片的開發工作。同時他表示,堅信Keller可以打造出“世界上***的AI定制硬件”。
Keller如此被馬斯克信任也不是沒有原因。他可以稱得上是天才架構師,最早時在DEC工作時,參與設計了Alpha 21164和21264處理器,被應用在許多大型主機中,包括中國超級計算濟南中芯的神威藍光超級計算器;在AMD期間,設計出了K7和K8等知名架構,業界首款突破GHz的CPU架構便是出自其手;后來又在蘋果設計出了A4、A5處理器,這是當年iPhone最核心的部件;在回到AMD之后,Keller奉獻了Zen架構,基于此架構的Ryzen讓AMD在2017年咸魚翻身。
在2016年跳槽到特斯拉之后,Jim Keller從AMD帶走了一批架構師和高管,根據CNBC在9月份的一則報道,特斯拉已經有超過50人在從事AI芯片的開發了,從中也可以看出特斯拉早已置下的自研AI芯片的野心。
AI芯片事關特斯拉自動駕駛的未來
在自動輔助駕駛系統Autopilot直至8.0版本之前,特斯拉一直采用的是Mobileye的Eye Q3芯片。Mobileye是一家創立于以色列的公司,專注于ADAS(高級輔助駕駛系統)的軟硬件開發,其特有的EyeQ視覺識別芯片以及ADAS軟件被應用于多家汽車廠商,如沃爾沃、寶馬、奧迪等。Mobileye的優勢很明顯:自由空間標記、啟發式路徑尋找、道路避障和路牌識別。
不過,特斯拉并沒有完全采用Mobileye的軟件,而是通過自己的軟件結合Mobileye以及英偉達硬件來實現自己的自動輔助駕駛。Mobileye的Amnon博士曾親口證實過,特斯拉的自動輔助駕駛使用了一部分EyeQ3的計算能力,而沒有使用其自有的功能,如紅綠燈識別,無中間黃線的雙行道識別等;另外,去年5月發生的***起自動輔助駕駛中產生的車禍也能證明此事。
當時,一位司機駕駛特斯拉的Model S在佛羅里達一條未封閉的高速上因為與橫穿馬路的大卡車相撞而喪命,Mobileye的發言人澄清說自己的系統主要是應對于追尾導致的碰撞,而不能勝任這樣的碰撞檢測,類似這樣的情況會在2018年左右的新系統中解決,而特斯拉的發言人則回應說,特斯拉雖然使用了Mobileye的芯片,但是技術上已經涵蓋了這種碰撞處理,只是由于當時環境條件導致失誤,沒能阻止慘劇發生。
在發生這起車禍時,攝像頭剛好遇到太陽下山時強烈的背光導致識別能力不足,收集到的數據不完備,而這不完備的2D數據又經過圖像識別加工成錯誤的3D場景,讓車誤判了前方的路況,從而釀成慘禍。
這次車禍是在一個非常極端的情況下,各種負面因素累加而成的結果,屬于系統的一次“漏報”,然而這也暴露了Mobileye技術的不足。此次教訓讓特斯拉延遲了計劃中的8.0系統的發布,且直接加速雷達主導的自動輔助駕駛時代的來臨。
2016年7月,特斯拉與Mobileye分道揚鑣,同年10月,搭載Autopilot 2.0自動駕駛輔助系統的車型開始量產。
Autopilot 1.0是基于Mobileye的圖像識別技術,主要數據來自于車頂的Mobileye攝像頭,車首的雷達和周邊雷達只是提供輔助信息;而Autopilot 2.0則是基于雷達識別環境,主要數據來源于車身上的雷達,而輔助數據則來源于車隊學習的高精度地圖和白名單。
在硬件部分,Autopilot 2.0使用了3個前置攝像頭(不同視角 廣角、長焦、中等)、2個側邊攝像頭(一左一右)、3個后置攝像頭、12個超聲波傳感器(傳感距離增加一倍)、一個前置雷達(增強版)、一個后置倒車攝像頭,而芯片則使用了英偉達DrivePX 2(40x Autopilot 1.0處理速度)。
英偉達CEO黃仁勛曾表示:“英偉達Drive PX 2是全球首款專為主動駕馭轎車規劃的AI超級計算機,它的運算才能與150臺MacBook Pro相當。”
馬斯克接受采訪時表明,在芯片挑選上,AMD和英偉達并沒有太大區別,當然特斯拉終究挑選了英偉達。但這番表述好像表明,特斯拉在芯片挑選上是十分靈敏的。
不過,特斯拉才投向英偉達的方案沒多久,為何又想移情別戀?這要從GPU架構的先天限制說起。
GPU的功耗極為龐大,且推理能力差,基于GPU架構的自動駕駛方案也有同樣的問題。以自動駕駛最常用的CNN卷積神經網絡來說,英偉達的Drive PX2推理性能上其實并不算特別出色。為了達到L3、甚至L4以上的自動駕駛功能,Drive PX2***端的完整自動駕駛版本功耗達250w,性能卻只有20 TFLOPS,因此特斯拉要求英偉達為其定制了一個特殊版本,將***端版本的規模減半,性能只剩下10 TFLOPS,功耗也大幅降低到100W左右,降低對電池壽命的影響,避免行駛里程過低,但也因此,其自動駕駛能力勉強只能達到L3的程度,而不是其宣稱的L5。
據稱,英偉達推出的下一代Xavier自動駕駛平臺在增加性能同時又大幅降低了功耗,理論上特斯拉只要直接升級就好,但根據NVIDIA自己的說法,L5級別的自動駕駛需要兩套Xavier共同合作才能達成。如此一來,成本上的負擔又會增加了。完整版Drive PX2要價1.5萬美元,Xavier只會更貴,若要達成L5自動駕駛則必須搭配兩套Xavier以及周邊傳感器,成本恐怕是天價。
另外,曾經的好伙伴Mobileye也即將推出高一級的Eye Q4和Eye Q5。前者可以在3W的功耗下達到2.5 TFLOPS的效率,后者則是在10W的功耗下達到24 TFLOPS。Eye Q系列都是采用CPU混搭向量加速單元來做自動駕駛所需要的卷積神經網絡計算,嚴格上來說,就是CPU結合ASIC處理單元的異構產品。
下一代Eye Q4方案要到2018年才會量產。前不久宣布正式上市的蔚來首款量產車ES8就是全球首款安裝Mobileye Eye Q4芯片的車型;而唯一具競爭力的EyeQ5要到2019年甚至更晚才有機會面世,急于推出更高等級自動駕駛功能的特斯拉無法繼續等待,這恐怕是特斯拉打定主意開發自己的AI芯片的原因之一。
自動駕駛的火熱引燃了AI芯片大戰
特斯拉與Mobileye、英偉達的分分合合只是自動駕駛芯片大戰中的冰山一角,其他如英特爾、高通等巨頭也在火力全開加速創新。
2016年,英特爾以167億美元完成了對世界第二大FPGA公司Altera的收購。
目前主流的自動駕駛芯片解決方案主要包括GPU、FPGA、DSP和ASIC四種。相對而言,FPGA高實時,低功耗,可靈活編程,這全都切中了自動駕駛對計算芯片的要求。英特爾在年初推出的自動駕駛計算平臺Intel Go中,就使用了FPGA芯片。奧迪新A8自動駕駛所仰賴的核心計算單元zFAS,也使用了Altera的FPGA芯片,內建被英特爾收購的Movidius視覺算法,負責物體數據和地圖數據的融合,與自動停車功能的實現。
另外,結合FPGA,英特爾可以在云端處理大量并發的實時計算。這種模式尤其適合人們對智慧城市大腦的設想:每一輛無人車的數據都上傳到一個中樞,由其處理并洞悉每一輛車的狀態,再命令他們如何駕駛。要實現如此,需要5G高寬帶、時延低的數據通道,為此英特爾在今年推出了首款車載5G通信平臺。
然而,雖然這一套設想很先進,但是目前短期內實現難度較大,英特爾今年3月以153億美元價格收購了以色列ADAS公司Mobileye,是以先參與進自動輔助駕駛技術的落地。
Mobileye一方面為英特爾提供了切入自動駕駛市場的渠道——前者在全球ADAS市場的份額超過70%;另一方面,Mobileye的核心產品——ADAS專用芯片Eye Q系列,使英特爾形成了針對車輛端的計算芯片解決方案——英特爾的凌動/至強+Mobileye的EyeQ+Altera的FPGA。這153億美元,其實是英特爾為自動駕駛買的門票。
至于高通,由于專注于移動端,其在高性能計算上的積累不如英特爾與英偉達。驍龍SoC雖然在單位能耗上相對英特爾與英偉達的計算平臺都占據優勢,但在峰值性能輸出上則被其功耗限制。加之驍龍SoC又并非為ADAS專門打造的計算平臺,因此想要打開自動駕駛汽車的市場,面臨的阻力不小。
去年10月,高通宣布與全球***的汽車半導體廠商恩智浦達成收購協議。恩智浦在被高通宣布收購之前,就已推出了ADAS專用芯片S32V234,主要用于處理視覺信號,可同時處理兩路視頻。值得一提的是,考慮到ADAS對安全性的要求,S32V234在設計之初就加入了ECC(錯誤檢查與糾正),FCCU(故障收集與控制單元)等安全機制。
隨后在此基礎上,恩智浦發布了BlueBox車載電腦,內部除了搭載S32V234芯片,還加上了應用8核A72的高性能處理器LS2088以及其他傳感器芯片,除了支持ADAS,還能夠實現多傳感器數據的融合。恩智浦稱,BlueBox能夠為L4級別的自動駕駛提供運算支持,而功耗不超過40W。
不過,高通對恩智浦的收購并非一帆風順,由于雙方未能提供相關文件,歐盟反壟斷機構于今年6月暫停了對這一收購的反壟斷調查,交易遲遲未能完成,高通便無法同恩智浦作為一個整體施行其戰略。此外,持有恩智浦半導體股份的埃利奧特管理公司認為高通低估了恩智浦半導體股票的價格,要求將每股的收購價格有110美元提高到135美元,不過高通拒絕提高收購報價,表示每股110美元公平合理,此事也為這一收購案再添風波。
好在,高通還可以專注于V2X車聯網。今年9月,高通推出新一代V2X通信芯片組9150C-V2X,符合3GPP標準,同時支持4G與5G網絡,無需SIM卡,就能夠實現車對車(V2V),車對基礎設施(V2I),車對行人(V2P)三種場景的通信。如果能夠利用5G的高速傳輸,將數據送至云端再快速處理下發,高通或許可以通過車聯網來實現自動駕駛功能,也算是在這場激烈的芯片競爭中另辟蹊徑。
在自動駕駛方面,我們還不得不提到谷歌。谷歌的自動駕駛方案使用了英特爾提供的至強處理器、Altera提供的Arria FPGA芯片以及英特爾家的XMM通信芯片。不過,負責推斷的部分究竟用的谷歌自家的TPU,還是英特爾的芯片,或是英偉達的GPU,都不明朗。需要說明的是,谷歌的TPU,就是一種專用于推斷階段的ASIC。當然,在其第二代Cloud TPU上,谷歌也為其增添了深度學習訓練的能力。
而在國內,近日地平線正式發布兩款計算機視覺嵌入式AI芯片——旭日和征程,分別面向智能駕駛和智能攝像頭。這是中國首款嵌入式人工智能芯片,相較于其他芯片,旭日和征程在性能、功耗、面積等方面都有了較大的提升,不僅可同時識別200個對象,芯片乘法器利用率峰值更高達100%,可強耦合于各種應用場景。
我們不難看出,在AI行業快速發展的當下,計算能力成為技術發展和應用落地***的關鍵因素,而作為主要承載硬件計算功能的芯片,也隨之成為了“革新”的對象。如今AI芯片正處在不斷突破的黃金年代,創新再創新,成為現階段AI芯片的主題。