特斯拉前AI總監(jiān)Karpathy解密離職和純視覺方案
特斯拉前人工智能總監(jiān),新晉AI網(wǎng)紅老師Andrej Karpathy近日參加了MIT人工智能專家Lex Fridman的播客節(jié)目。對于人工智能愛好者來說,這次訪談可謂是「雙廚狂喜」。
將近三個半小時的訪談中,兩人談?wù)摿巳斯ぶ悄堋⒂钪妗⑷祟惿鐣群甏竺},還具體討論了特斯拉的多項技術(shù),如自動駕駛、Optimus人形機(jī)器人、和特斯拉視覺方案。此外,兩人還聊到了觀眾最關(guān)心的Andrej的離職,以及特斯拉取消超聲波雷達(dá)的原因。
不用雷達(dá):貴還難使!
特斯拉去年從傳感器套件中刪除了毫米波雷達(dá),剛剛又宣布要移除所有超聲波雷達(dá),只保留攝像頭,采用純視覺方案。Lex問道:「這使車輛的道路探測變得更難還是更容易?」
Karpathy表示:「人們大都會認(rèn)為這些傳感器是汽車的不可或缺的資產(chǎn),但如果充分考慮產(chǎn)品的整體性,這些傳感器實際上是潛在的負(fù)擔(dān)。」
「這些傳感器不是免費的,不可能憑空出現(xiàn)在車上。不僅需要有一個完整的供應(yīng)鏈,還需要有人負(fù)責(zé)采購,」而這些都是要花真金白銀的。
同時,傳感器可能會故障,需要更換。「作為汽車制造的一部分,傳感器的生產(chǎn)還可能拖累整體進(jìn)度。所以,你不僅需要采購和維護(hù),還必須有編寫固件的團(tuán)隊。」
不僅如此,使用雷達(dá)傳感器還會導(dǎo)致探測系統(tǒng)的冗雜。Karpathy說:「把它們納入到汽車系統(tǒng)中后,會導(dǎo)致系統(tǒng)整體的過度膨脹。」
安裝這么多的傳感器對數(shù)據(jù)引擎也會造成壓力。隨時間不斷發(fā)生發(fā)展,傳感器的功能越來越細(xì)化。「現(xiàn)在有太多的雷達(dá),每個的功能都不盡相同。這造成了探測系統(tǒng)的過度膨脹。此外,過多的雷達(dá)還會互相干擾,影響效果。」
他高度贊揚前老板馬斯克化繁為簡的能力,「我認(rèn)為埃隆很擅長簡化,他曾說:『最好的部件是沒有部件。』他總會嘗試拋棄那些不重要的東西,一直在做減法,因為他了解組織的熵增現(xiàn)象。」
成本高,問題多,需要人員不斷修復(fù)。還會帶來探測系統(tǒng)的冗雜。在這種情況下,安裝雷達(dá)的成本很高,并且沒有很大的發(fā)展?jié)摿Α?/span>
「作為一個計算機(jī)視覺工程師,想改善車輛的探測網(wǎng)絡(luò),就會考慮增加傳感器是否有用,有多大用處。我們進(jìn)行對比試驗,真正確定雷達(dá)是否能給車主提供非常有用的路況信息。但結(jié)果表明區(qū)別并不大,這說明雷達(dá)并沒有用。」
Karpathy不僅解釋特斯拉拋棄這項技術(shù)的原因,還斷言其他汽車公司也會做出相同的選擇。「和激光雷達(dá)相似,我認(rèn)為超聲波雷達(dá)不能提供很多額外信息。我認(rèn)為其他還在用激光雷達(dá)的公司也會拋棄這項技術(shù)的。」
純視覺方案:更勝一籌
Karpathy對于純視覺方案抱有很大希望。「如果選擇純視覺方案,我們可以集中所有資源,建立強大的數(shù)據(jù)引擎。」
「這種傳感器的帶寬非常高,我們在這方面取得了實質(zhì)進(jìn)展。只要大力投資該技術(shù),就可以獲得非凡的成就。」
Karpathy表示,純視覺方案既是必要的,也是充分的。某種意義上講,世界是為了人類的視覺消費而被設(shè)計出來的,人們有視覺上的需求。
同時,該方案能提供所有駕駛者需要的全部駕駛信息。「因此,我們必須集中資源發(fā)展這項技術(shù),并不斷問自己:『我真的要引入其他的傳感器嗎?』我認(rèn)為這種情況下的答案是否定的。」
雖然純視覺方案獲得Karpathy的大力支持,但當(dāng)Lex問及如何看待激光雷達(dá)和純視覺方案,以及點云和體素之間的區(qū)別時,Karpathy坦言:兩者不是自動化駕駛的重點。
他說:「我一直看不懂這個爭論。因為這不是問題的核心。我覺得大家在討論自動化時應(yīng)該關(guān)注是否有路測車隊作為支撐。這個才是人工智能系統(tǒng)能否更好服務(wù)的關(guān)鍵。」
因此,在考慮傳感器的探測能力時必須要全面。包括能否提供路測車隊來收集大量數(shù)據(jù),能否整合傳感器與數(shù)據(jù),并將傳感器整合到數(shù)據(jù)引擎中,實現(xiàn)數(shù)據(jù)不同部分的快速搜索,之后不斷改進(jìn)所使用的模型。
厘米級地圖:沒必要!
當(dāng)被問及如何看待其他公司制作運營地區(qū)的自動駕駛汽車高清地圖時,Karpathy表示:「太瘋狂了!」
「我們一直在談?wù)撟詣玉{駛?cè)绾胃淖兪澜纾務(wù)撊蚍秶鷥?nèi)該技術(shù)如何運用到交通領(lǐng)域。如果你需要持續(xù)提供一個厘米級精準(zhǔn)的世界或城市地圖,并保持更新頻率,這個成本太大了。」
當(dāng)Lex問這種做法是否會擴(kuò)展到美國的全部地區(qū)時,Karpathy用特斯拉的例子現(xiàn)身說法:「人們不需要如此高精度的地圖。一個低精度的地圖足以展現(xiàn)路況和前方路段等關(guān)鍵信息。駕駛者可以像看谷歌地圖一樣,通過這些關(guān)鍵信息理解自己所處環(huán)境。」
「特斯拉在駕駛系統(tǒng)中使用和谷歌地圖類似分辨率的信息。但不會預(yù)先繪制厘米級精度的地圖。這種做法畫蛇添足,費力不討好,還稀釋了團(tuán)隊能力,讓技術(shù)人員無法專注于真正必要的東西,那就是計算機(jī)視覺問題。」
離職后還會回來?這就是愛
在談及為何離開特斯拉時,Karpathy表示這是個艱難的決定。雖然特斯拉還未完全實現(xiàn)自動化駕駛,但研發(fā)團(tuán)隊已經(jīng)可以自行發(fā)展。這次離職也給他一個機(jī)會,去重新審視自己對于人工智能、開源和教育的熱愛。
此前,他供職特斯拉已有5年,直接向大老板馬斯克匯報,在特斯拉的一眾高管中,絕對算得上是老資格了。據(jù)報道,此前這位李飛飛的高徒已經(jīng)休假了幾個月時間,之前還曾說過,近期結(jié)束休假后就將重返特斯拉,結(jié)果直接宣布離職了。
Karpathy表示:「很高興在過去5年里協(xié)助特斯拉一起實現(xiàn)了眾多目標(biāo),離開的決定其實是個艱難的選擇。這5年里,自動駕駛完成了『畢業(yè)』,從蹣跚尋路開始,開上了城市的街頭。我無比期待未來更強大的自動駕駛團(tuán)隊能夠繼續(xù)輝煌下去。」
關(guān)于離職之后的未來打算,他表示:「未來還沒什么具體的計劃,可能回歸自己擁有長期熱情的領(lǐng)域,比如AI技術(shù)工作、開源和教育等。」
當(dāng)然,他在訪談中也提到重回特斯拉的可能性:「或許在某個時候我會回來,在特斯拉從事Optimus或AGI(通用人工智能)的工作。特斯拉將是一個了不起的公司,可以創(chuàng)造非凡。在這個大規(guī)模的機(jī)器人公司,有才華的設(shè)計師們正創(chuàng)造前所未有的新事物。」
從特斯拉高管到網(wǎng)紅老師,Karpathy可以為了人工智能離開特斯拉,也可以為了人形機(jī)器人和AGI有朝一日重返崗位。他追求的不是物質(zhì)與地位,而是技術(shù)的不斷進(jìn)步。這和其導(dǎo)師李飛飛畢業(yè)后拒絕轉(zhuǎn)行,堅守計算機(jī)圖像識別研究的行為異曲同工。或許,這就是「有其師必有其徒」吧!