嘉賓丨王肖
撰稿丨千山
欄目介紹:《技術(shù)人訪談錄》是51CTO旗下的一檔人物訪談欄目,通過(guò)對(duì)不同行業(yè)/領(lǐng)域的技術(shù)大咖進(jìn)行深入訪談,展現(xiàn)他們的人生閱歷、發(fā)掘他們的價(jià)值理念、分享他們的職業(yè)經(jīng)驗(yàn),帶你走進(jìn)技術(shù)人的世界!
“我國(guó)自動(dòng)駕駛研發(fā)由前期的概念集成轉(zhuǎn)向更加務(wù)實(shí)的技術(shù)攻關(guān)。”這是人民網(wǎng)研究院于近期發(fā)布的《中國(guó)移動(dòng)互聯(lián)網(wǎng)發(fā)展報(bào)告(2022)》里的論斷。
資料顯示,我國(guó)L2智能駕駛輔助產(chǎn)品裝車率連年攀升,同時(shí),傳統(tǒng)和新勢(shì)力車企不斷加強(qiáng)智能化技術(shù)應(yīng)用,覆蓋多場(chǎng)景的自動(dòng)駕駛功能在量產(chǎn)車上集中搭載。但是,時(shí)而出現(xiàn)的智能駕駛輔助系統(tǒng)事故讓人憂心,自動(dòng)駕駛的技術(shù)成熟度和相關(guān)倫理爭(zhēng)議、法規(guī)缺位也讓人有所猶疑。
如何看待自動(dòng)駕駛產(chǎn)品化面臨的挑戰(zhàn)?自動(dòng)駕駛領(lǐng)域,量產(chǎn)商用的前提條件是什么?自動(dòng)駕駛真正落地的關(guān)鍵在哪里?圍繞這些議題,《技術(shù)人訪談錄》特邀無(wú)人駕駛企業(yè)北京智行者科技股份有限公司(以下簡(jiǎn)稱“智行者”)CTO王肖,聊一聊他投身自動(dòng)駕駛的這些年。
專業(yè):是“時(shí)之所趨”,也是“己之所愿”
王肖畢業(yè)于清華大學(xué)汽車工程系,攻讀博士學(xué)位時(shí),主持多個(gè)橫縱向課題研發(fā),累計(jì)發(fā)表10余篇SCI/EI/行業(yè)頂級(jí)論文。2015年,作為聯(lián)合創(chuàng)始人創(chuàng)辦了智行者,擔(dān)任CTO一職,全面負(fù)責(zé)公司整體技術(shù)規(guī)劃及實(shí)施工作。
談及為何選擇汽車工程專業(yè),王肖提到兩點(diǎn):
其一,時(shí)之所趨。客觀來(lái)說(shuō),中國(guó)是汽車大國(guó),但并非汽車強(qiáng)國(guó)。而智能網(wǎng)聯(lián)汽車對(duì)中國(guó)的汽車工業(yè)而言是很大的機(jī)遇,也是彎道超車的好機(jī)會(huì)。
其二,興趣所在。王肖本身對(duì)計(jì)算機(jī)、軟件、人工智能都有很強(qiáng)的好奇心和求知欲,因此考慮到,如果傳統(tǒng)的汽車工業(yè)有這些新興技術(shù)的加持,進(jìn)而打造出自動(dòng)駕駛的車輛,在王肖看來(lái)是一件很酷的事情。“能夠把個(gè)人興趣同行業(yè)發(fā)展結(jié)合在一起是非常幸運(yùn)的,所以我堅(jiān)定不移地選擇了這個(gè)方向。”
回顧個(gè)人的成長(zhǎng)軌跡,對(duì)于將自動(dòng)駕駛作為學(xué)習(xí)和工作的方向,王肖深感這是他人生中最重大的轉(zhuǎn)折點(diǎn)之一。
“通常來(lái)說(shuō),傳統(tǒng)的汽車專業(yè)會(huì)主攻機(jī)械、發(fā)動(dòng)機(jī)、底盤(pán)等領(lǐng)域的知識(shí),但在我求學(xué)的時(shí)候趕上了智能化時(shí)代,雖然偶爾也有迷茫,但自然而然地就在這個(gè)方向上堅(jiān)持了下來(lái)。”
作家柳青在《創(chuàng)業(yè)史》中寫(xiě)道:“人生的道路雖然漫長(zhǎng),但要緊處常常只有幾步,特別是當(dāng)人年輕的時(shí)候。”沒(méi)有人的人生是一條直道,站在岔路口,你做下選擇的一個(gè)個(gè)瞬間累加起來(lái)就是生活。
抉擇:智行者開(kāi)辟的第三條路
近年來(lái),關(guān)于自動(dòng)駕駛的新聞不絕于耳,其發(fā)展有目共睹,其瓶頸也備受關(guān)注。從實(shí)驗(yàn)室到市場(chǎng),自動(dòng)駕駛的產(chǎn)品化到底要跨越哪些藩籬?王肖認(rèn)為,自動(dòng)駕駛作為新生事物,面臨的挑戰(zhàn)眾多,其中難度最大的三點(diǎn)分別是:成本、技術(shù)復(fù)雜性和場(chǎng)景選擇。
成本。自動(dòng)駕駛涉及很多昂貴的硬件,包括激光雷達(dá)、高算力芯片等等。“我上學(xué)的時(shí)候,一個(gè)傳感器動(dòng)輒是幾十萬(wàn)甚至上百萬(wàn)。”可以說(shuō),自動(dòng)駕駛行業(yè)整體成本較高,一定程度上拖慢了商業(yè)化速度。
技術(shù)復(fù)雜性。自動(dòng)駕駛是一個(gè)極其復(fù)雜的綜合體,融合了機(jī)械、電子、人工智能、自動(dòng)化等相關(guān)技術(shù)。“特別是考慮到城市的復(fù)雜路況,比如robotaxi等場(chǎng)景應(yīng)用存在很多長(zhǎng)尾問(wèn)題,Google已經(jīng)做了十多年仍然沒(méi)有實(shí)現(xiàn)商業(yè)化,可見(jiàn)自動(dòng)駕駛技術(shù)難度之高。”
場(chǎng)景選擇。自動(dòng)駕駛可應(yīng)用的場(chǎng)景非常多,在諸多的場(chǎng)景中,如何選擇到具有剛需的、市場(chǎng)空間足夠大的場(chǎng)景,對(duì)企業(yè)來(lái)說(shuō)是一大挑戰(zhàn)。“自動(dòng)駕駛到底能給用戶解決什么痛點(diǎn),在什么樣的場(chǎng)景下他們?cè)敢鉃榇速I單,找準(zhǔn)了切入點(diǎn)才是落地的關(guān)鍵。”
放眼當(dāng)下的自動(dòng)駕駛賽道,圍繞商業(yè)化進(jìn)行的探索主要分為兩種典型模式。王肖對(duì)此進(jìn)行了說(shuō)明。
第一種是Waymo模式,即通過(guò)部署復(fù)雜的傳感器、昂貴的設(shè)備直接定位L4/L5級(jí)別自動(dòng)駕駛。“這種模式主要是想一步到位,把車輛直接全部無(wú)人化,以此來(lái)做商業(yè)運(yùn)營(yíng)。但目前來(lái)說(shuō),這一路線成本高,技術(shù)難度也高,商業(yè)化落地很難。”
第二種是特斯拉模式,即通過(guò)車輛的商業(yè)化應(yīng)用,不斷收集數(shù)據(jù),并以此迭代算法,逐漸提升至自動(dòng)駕駛級(jí)別。“這種模式通過(guò)便宜的傳感器(例如相機(jī))來(lái)采集數(shù)據(jù),越多車輛進(jìn)入實(shí)際駕駛場(chǎng)景,數(shù)據(jù)越豐富,車輛就能被訓(xùn)練得越聰明。這種漸進(jìn)模式已經(jīng)被特斯拉證明是非常成功的。”
面對(duì)這兩種發(fā)展路線,成立于2015年的智行者選擇了第三條路——兩者結(jié)合的模式。
“我們將自研的L4級(jí)別無(wú)人駕駛大腦從場(chǎng)景和應(yīng)用級(jí)別上進(jìn)行降維應(yīng)用,比如應(yīng)用到環(huán)衛(wèi)、物流配送等低速場(chǎng)景以及L2/L2+/L3級(jí)別的乘用車自動(dòng)駕駛領(lǐng)域,并在上述場(chǎng)景實(shí)現(xiàn)了規(guī)模化商用落地。”
王肖作了進(jìn)一步說(shuō)明:因?yàn)橹切姓叩亩ㄎ皇亲鰺o(wú)人駕駛大腦,因此主要采用的是L4級(jí)(即Waymo模式)。但在推進(jìn)落地的時(shí)候,首先落地到低速的封閉園區(qū)一類的特定領(lǐng)域。通過(guò)大量的產(chǎn)品落地,來(lái)獲得更為多樣化的數(shù)據(jù)反饋,從而豐富多種數(shù)據(jù)的維度和場(chǎng)景。如此一來(lái),讓無(wú)人駕駛大腦越來(lái)越聰明,最終穩(wěn)步邁向L4級(jí)無(wú)人駕駛時(shí)代。
對(duì)于前景,王肖表現(xiàn)得比較審慎:“相信那應(yīng)該是五到十年之后的事情,但是我們目前必須扎扎實(shí)實(shí)地做好每一步。”
落地:以通用型無(wú)人駕駛大腦賦能多場(chǎng)景
作為自動(dòng)駕駛陣營(yíng)中的“創(chuàng)業(yè)派”,智行者團(tuán)隊(duì)在成立之初就決定將研發(fā)方向定位于“無(wú)人駕駛大腦”,七年來(lái)也始終將主要精力聚焦于此。
自動(dòng)駕駛涉及環(huán)境感知、規(guī)劃決策、執(zhí)行控制等各環(huán)節(jié)。為什么要做無(wú)人駕駛大腦?王肖將其歸因于兩點(diǎn)。
第一,智行者認(rèn)為未來(lái)的自動(dòng)駕駛必須要像人腦一樣具有高度的智慧,才能適應(yīng)不同的場(chǎng)景。“一個(gè)合格的無(wú)人駕駛大腦要像一個(gè)合格的司機(jī)一樣,無(wú)論是何種場(chǎng)景、何種車型,它都要具備自學(xué)習(xí)和遷移學(xué)習(xí)的能力,而不是一個(gè)大腦只能適用一個(gè)場(chǎng)景,只有這種通用型無(wú)人駕駛技術(shù)才能更高效地賦能多種場(chǎng)景,真正地實(shí)現(xiàn)技術(shù)落地。”
第二,自動(dòng)駕駛的各個(gè)環(huán)節(jié)都有很高的實(shí)現(xiàn)難度,但更大瓶頸在于規(guī)劃決策方面。“在環(huán)境感知方面,我認(rèn)為現(xiàn)在的自動(dòng)駕駛技術(shù)已經(jīng)達(dá)到甚至超過(guò)了人眼的水平。但規(guī)劃決策方面,自動(dòng)駕駛技術(shù)還遠(yuǎn)不及人的思維靈活多變。比如在復(fù)雜的擁堵場(chǎng)景中就會(huì)涉及到駕駛員之間的博弈策略,在這種情況下,自動(dòng)駕駛可能因?yàn)椴呗员J囟e步維艱。”從這一層面考慮,“無(wú)人駕駛大腦”是更具挑戰(zhàn)性的一個(gè)方向。
王肖介紹,智行者無(wú)人駕駛大腦包含了自動(dòng)駕駛中央計(jì)算單元(AVCU)、自動(dòng)駕駛操作平臺(tái)(AVOS)、自動(dòng)駕駛數(shù)據(jù)閉環(huán)系統(tǒng)(AVDC)三大模塊。三大模塊之間具有高內(nèi)聚、低耦合的特點(diǎn),可以保證不同場(chǎng)景的功能復(fù)用和快速部署,能夠高效賦能robotaxi、robobus、環(huán)衛(wèi)、物流及特種領(lǐng)域等多個(gè)場(chǎng)景,是行業(yè)內(nèi)少有的通用型“大腦”。
具體來(lái)說(shuō),AVCU即自動(dòng)駕駛控制器,類似于大腦里的物理結(jié)構(gòu),是硬件的基礎(chǔ);AVOS即自動(dòng)駕駛的操作系統(tǒng),就像人的思想靈魂,是關(guān)鍵的軟件;AVDC即自動(dòng)駕駛的數(shù)據(jù)中心,猶如人的學(xué)習(xí)能力,代表不斷模仿、習(xí)得、進(jìn)化的能力。
智行者的無(wú)人駕駛大腦之所以可以高效賦能多個(gè)場(chǎng)景離不開(kāi)“一體一環(huán)”的技術(shù)優(yōu)勢(shì)特點(diǎn)。“一體”是指智行者獨(dú)創(chuàng)的積木式架構(gòu),即將底層系統(tǒng)架構(gòu)模塊化,用搭積木的方式做無(wú)人駕駛,可大大提升不同場(chǎng)景技術(shù)落地效率。“一環(huán)”是指智行者打造的數(shù)據(jù)閉環(huán),通過(guò)多場(chǎng)景落地,智行者獲得了海量數(shù)據(jù)回流,打造了完善的數(shù)據(jù)閉環(huán)系統(tǒng),可以更低成本、更快速度迭代算法,形成更加強(qiáng)大的無(wú)人駕駛大腦。
王肖強(qiáng)調(diào):“基于無(wú)人駕駛大腦的組成和架構(gòu)優(yōu)勢(shì),我們才能在乘用車、特種車以及物流、環(huán)衛(wèi)等多個(gè)領(lǐng)域?qū)崿F(xiàn)落地。這些領(lǐng)域看似各有特色,場(chǎng)景多元,實(shí)際其底層邏輯是相通的。就像一個(gè)具有高度智慧的人類,可以應(yīng)對(duì)任何場(chǎng)景,并不會(huì)因?yàn)橥饨绺蓴_而影響行車。我們理想中的無(wú)人駕駛大腦能夠通過(guò)數(shù)據(jù)迭代不停進(jìn)化,而非一成不變。能保持進(jìn)化是區(qū)別于傳統(tǒng)汽車的最關(guān)鍵的部分,也是其最核心的意義和價(jià)值所在。”
普及:長(zhǎng)路漫漫,任重而道遠(yuǎn)
盡管自動(dòng)駕駛的未來(lái)市場(chǎng)空間可達(dá)萬(wàn)億級(jí),但真正實(shí)現(xiàn)規(guī)模化的量產(chǎn)商用依舊任重道遠(yuǎn)。王肖認(rèn)為,要達(dá)成量產(chǎn),必須滿足三個(gè)前提條件:
安全。對(duì)汽車來(lái)講,安全永遠(yuǎn)是第一位的。智能是安全的提高及輔助,只有在保證足夠安全的情況之下才能談發(fā)展。
規(guī)模。要收集更多的數(shù)據(jù),必須要有更大規(guī)模的自動(dòng)駕駛的投放。當(dāng)下,國(guó)內(nèi)的自動(dòng)駕駛的普及率相對(duì)來(lái)說(shuō)還比較低。只有當(dāng)智能化程度越來(lái)越高,民眾的認(rèn)知和接受程度越來(lái)越高,每年有更多的智能汽車投放到市場(chǎng),才能形成規(guī)模效應(yīng)。
成本。老百姓愿意付多少錢(qián)去購(gòu)買自動(dòng)駕駛汽車,這一點(diǎn)非常重要。而且當(dāng)前老百姓還沒(méi)有切實(shí)地感覺(jué)到自動(dòng)駕駛帶來(lái)的超出預(yù)期的好處。如何在控制好成本的前提下更好地解決用戶的痛點(diǎn)問(wèn)題是業(yè)內(nèi)需要努力的方向。
自動(dòng)駕駛的長(zhǎng)遠(yuǎn)發(fā)展除了需要依靠技術(shù)的革新、市場(chǎng)的蓬勃外,還需要更多人才的投入。王肖對(duì)有志于在自動(dòng)駕駛領(lǐng)域有所作為的同學(xué)給出了自己的建議:
1、打好基礎(chǔ)。建議從底層工程師開(kāi)始干起,學(xué)習(xí)包括傳感器的知識(shí)、車輛的調(diào)試以及編程相關(guān)技能等等,一定要打好地基。
2、多關(guān)注國(guó)外的最新發(fā)展方向,包括閱讀最先進(jìn)的論文以及關(guān)注類似于特斯拉等企業(yè)的研發(fā)方向、研究視頻,這樣才有利于建立起自己的國(guó)際化前沿視野。
3、結(jié)合自己的研究興趣和優(yōu)勢(shì),選好具體崗位,到底是從事算法工程師、軟件工程師還是硬件工程師,需要自己多加權(quán)衡。選好崗位之后,一定要深入地堅(jiān)持下去,長(zhǎng)期地學(xué)習(xí),這樣才能形成個(gè)人能力的護(hù)城河,才能走得更遠(yuǎn)。
“自動(dòng)駕駛需要大量的軟件、算法、芯片以及電子電器類的人才,希望對(duì)這個(gè)方面感興趣的同學(xué)多關(guān)注這個(gè)領(lǐng)域的發(fā)展。”
結(jié)語(yǔ)
在未來(lái)的5-10年,自動(dòng)駕駛有望獲得更具革新性的發(fā)展,改變我們生活和工作的方方面面。但正如王肖所說(shuō)“再宏大的故事,再激昂的暢想,都需要從業(yè)者踏踏實(shí)實(shí)的落地,都需要形成正向的商業(yè)閉環(huán)、產(chǎn)品閉環(huán),讓投資者和大眾都對(duì)自動(dòng)駕駛技術(shù)充滿信心”。唯有如此,自動(dòng)駕駛才有可能像今日的智能手機(jī)一樣,真正進(jìn)入“尋常百姓家”。