李飛飛最新訪談:沒有空間智能,AGI就不完整
這是“AI教母”李飛飛在最新訪談中對AGI的判斷——是的,李飛飛也開始談論AGI了。
不過她有自己的表述,從進入人工智能領域開始,她就確定了她終身奮斗的夢想:讓智能體能夠講述世界的故事。
而這,離不開空間智能。
圖片
正如她本人所說:
我整個職業生涯都在追逐那些極其困難、近乎瘋狂的問題。
李飛飛如今聚焦于空間智能領域——這個人工智能最艱難的領域之一。
她認為3D世界建模對于實現AGI至關重要,并表示:
理解三維世界、生成三維世界、推理三維世界、在三維世界中做事,是人工智能的基本問題。
她的目標是創建一個超越平面像素、跨越語言障礙、能夠真正捕捉三維世界結構和空間智能的世界模型。
在這次對話中,她從ImageNet的起源和影響說起,講述了AI范式轉變與關鍵突破,并提到了3D建模面臨的挑戰以及空間智能的數據缺失問題。
量子位翻譯并總結了全文,讓我們一起來學習李飛飛的最新認知和分享。
ImageNet為現代計算機視覺搭建數據骨架
Q:你最早創建的項目之一是2009年的ImageNet,距今已有16年了。那篇文章有超過8萬次引用,真正觸及了人工智能的一個關鍵問題,即數據問題。請告訴我們那個項目是如何產生的——在那會兒,這可是開創性的工作。
李飛飛:實際上,我們構思這個(ImageNet)已經是幾乎18年前的事情了。我曾在普林斯頓大學擔任助理教授,當時人工智能和機器學習的世界完全不同,數據非常少,至少在計算機視覺領域,算法并不起作用——那里沒有產業。你知道,就公眾而言,AI這個詞并不存在。
但是我們中間仍有一些人——從AI的創始人開始——然后是John McCarthy、Geoffrey Hinton等人。我想我們只是做了一個人工智能的夢:我們真的真的想讓機器能夠思考和行動。而我個人的夢想就是想讓機器能夠看見,因為看見是智能的基石。
視覺智能不僅僅是感知,它的真正意義在于理解世界并在世界中行動。我癡迷于讓機器看見的問題,在我當時癡迷地開發機器學習算法時,我們嘗試了神經網絡,但它沒有成功,然后我們轉向基礎網絡來支持向量機。
但有一個問題一直困擾著我,那就是泛化的問題:如果你在機器學習領域工作,你必須認識到泛化是機器學習的核心數學基礎或目標。為了泛化,這些算法需要數據。但當時還沒有人在計算機視覺領域有數據,而我是第一批開始接觸數據的研究生,因為我是最早看到互聯網、物聯網大發展的那一代研究生。
時間快進到21世紀,大約在2007年前后,我和我的學生決定,我們必須進行一次大膽的賭注:我們必須賭機器學習需要一次范式轉變,而這個轉變必須由數據驅動的方法引領,但當時根本沒有數據。
所以我們想,好吧,去互聯網上下載十億張圖片——那是當時我們能獲取到的最大數量——然后創建整個世界的視覺分類體系,并用這個來訓練和評估機器學習算法。這就是ImageNet被構想出來并誕生的原因。
自然語言與視覺信號的融合,讓智能體能夠講述世界的故事
Q:這個過程持續了一段時間,才發展出一些有前景的算法,直到2012年AlexNet出現,這才構成了通往人工智能的第二個關鍵部分——獲得計算能力,并投入足夠的資源到算法中。請告訴我們,您是什么時候開始意識到這一點的?就是當你發現“用數據播種”的方法開始奏效,整個AI社區在此基礎上取得了更多突破性進展的那個時刻。
李飛飛:在2009年,我們發表了一個非常小的CVPR海報,然后在2009年到2012年之間,那三年我們真的相信數據會驅動人工智能,但我們幾乎沒有關于它是否有效的信號。所以我們做了一些事情,其中一件就是開源。從一開始我們就相信,必須將這個項目開源給整個研究界,讓所有人都能參與進來。
另一件事情是,我們發起了一個挑戰賽,希望全世界最聰明、最優秀的學生和研究人員都能來解決這個問題。這就是我們所說的ImageNet挑戰賽。我們每年都會發布一個測試數據集,然后公開邀請所有人參與。最初幾年其實是在建立基準線——當時的識別錯誤率徘徊在30%左右,雖然不算完全隨機猜測的水平,但確實不盡如人意。
圖片
但是,在第三年也就是2012年(我在一本我出版的書中寫到了這一點),我依然記得那是在夏天快要結束的時候,我們正在處理ImageNet挑戰賽的所有結果,并在我們的服務器上運行,然后有一天深夜,我收到了我研究生的消息:他說我們得到了一個特別特別突出的結果,我應該看看。于是我們仔細研究了它,那是卷積神經網絡(convolutional neuronet network)之類的。
當時Geoffrey Hinton的團隊還不叫Alex這個名字,他們當時命名為“SuperVision”,這是對“超級視覺”和“監督學習”的巧妙雙關,所以“SuperVision”。
讓我們看看他們做了什么——這是一個老算法,卷積神經網絡在20世紀80年代問世,而他們在算法上做出了一些調整。最初看到這樣的飛躍變化,對我們來說還是挺令人驚訝的,嗯,你們知道,我們在那一年的意大利佛羅倫薩ICCV挑戰研討會上展示了這個,Alex Krizhevsky和很多研究者都來了。
圖片
如今這一刻已經被載入史冊,被稱為“ImageNet挑戰賽的AlexNet時刻”——這不僅僅是一個卷積神經網絡的應用,這是Alex和他的團隊第一次將兩個GPU并聯用于深度學習計算的壯舉。所以這實際上是數據、GPU和神經網絡第一次結合的時刻。
Q:現在,順著計算機視覺智能發展的趨勢,ImageNet真正成為解決物體識別概念的關鍵,然后緊接著,人工智能也達到了能夠解析視覺場景的程度。因為你和你的學生,比如Andrej Kaparthy,做了很多重要工作,讓AI首次實現了場景描述的能力。請告訴我們物體到場景是如何轉變的。
李飛飛:ImageNet解決的核心問題是:當系統接收一張圖像時,能夠準確識別其中的物體,比如“這里有一只貓”“那是一把椅子”等等。這是視覺識別中的一個基本問題。
從我作為研究生進入人工智能領域開始,我就有一個夢想,我認為這是一個長達一百年的夢想,即讓智能體能夠講述世界的故事:當你在這個房間睜開眼睛時,你看見的不僅僅是人、椅子、椅子和椅子,你實際上可以看到一整個會議室,有屏幕、有舞臺、有人、有觀眾,還有攝像機……你實際上能描述你看到的整個場景。這是人類視覺智能的基礎能力,對我們的日常生活來說至關重要。
所以我真的認為這個問題會困擾我的一生,字面意義上的,當我作為研究生畢業時,我告訴自己,如果我在臨終前能夠創造一個能夠講述場景故事的算法,我就成功了。
隨著Alex時刻的到來,深度學習迎來了爆發式發展。當Andrej和后來的Justin Johnson進入我的實驗室時,我們開始觀察到自然語言與視覺信號相互融合的跡象。隨后,我和Andrej提出了為圖像添加字幕或講故事的問題。長話短說,2015年左右,Andrej和我發表了一系列論文,同期也有幾篇類似研究,關于制造一臺可以為圖像添加字幕的計算機。那時我的感受是,天啊,我該怎么度過我的余生?那是我一生的目標,那對我們兩個人來說都是難以置信的時刻。
去年我做了一個TED演講,我實際上使用了Andrej幾年前在完成圖像字幕工作時發的推文,基本上就是他的論文。我還和他開了個玩笑,我說:“嘿Andrej,我們為什么不反過來做呢?取一個句子然后生成一張圖片?!碑斎凰牢以陂_玩笑,他說:“哈哈,我要走了~這個世界還沒有準備好?!笨爝M到今天,我們都知道生成式AI了,現在我們可以用一句話生成美麗的圖片。所以這個故事的寓意是,AI已經取得了不可思議的增長。
我個人認為我是世界上最幸運的人,因為我的整個職業生涯始于AI寒冬結束的初期,也就是AI開始騰飛的起點,而我自己的工作、我自己的職業生涯有很大一部分都參與了這一變革,或者為這一變革提供了助力。所以我感到非常幸運和自豪。
沒有空間智能,通用智能就不完整
Q:我認為最瘋狂的事情是,即使你實現了你一生的夢想——描述場景,甚至用擴散模型生成它們——你實際上還在夢想更大的事情,因為整個計算機視覺的發展歷程從物體變成了場景,而現在這個概念是整個世界,而你決定從學術界成為教授,到現在成為World Labs的創始人和CEO。請告訴我們,有什么是比看見物體更難的事情?
李飛飛:要總結過去五六年的經歷真的很難,我們正生活在科技進步的這樣一個文明時刻,對吧?而作為計算機視覺科學家,我們見證了計算機視覺從圖像識別到圖像描述再到使用擴散技術進行圖像生成的驚人發展,這一切都在以一種非常令人興奮的方式發生。
圖片
我們還有另一個同樣令人興奮的領域,那就是語言,也就是LLMs,2022年11月,ChatGPT打開了真正能夠通過圖靈測試的工作生成模型的大門。對我來說,這個進展非常鼓舞人心,即使是像我這樣年紀的人,也會大膽地思考未來會怎樣。
作為一名計算機視覺科學家,我有一個習慣——我的很多靈感其實都來自進化論和腦科學——在我的職業生涯中,我常常在尋找下一個要解決的目標問題,我問我自己,進化論做了什么,腦發育做了什么。有一點非常值得注意或者說值得欣賞的事情是,非常寬泛地來說,人類語言的進化發展大約花了3億年到5億年,還不到十億年,而且基本上人類是唯一擁有復雜語言的動物。我們可以爭論動物是否具有語言,但就語言作為交流、推理、抽象的工具而言,真正擁有語言的是人類,這花費的時間還不到5億年。
但想想視覺,想想理解三維世界的能力,弄清楚在這個三維世界中該做什么、導航三維世界、與三維世界互動、理解三維世界、交流三維世界……這個進化持續了5.4億年。5.4億年前,首批三葉蟲在水下進化出了視覺感知能力,而正是視覺的出現引爆了這場進化的軍備競賽。在視覺誕生前的五億年間,地球上的生物都極其簡單。但在隨后的5億年,也就是在這5.4億年里——正因生物獲得了觀察世界、理解世界的能力——進化競賽正式開啟,動物智能開始相互競爭。
所以對我來說,解決空間智能的問題:如何理解三維世界、生成三維世界、推理三維世界、在三維世界中做事,是人工智能的基本問題。在我看來,沒有空間智能,通用人工智能就不完整。我想要解決這個問題:這涉及到創造性的世界模型,它超越了平面像素、超越了語言,是真正捕捉三維世界的結構和空間智能的世界模型。
我一生中最幸運的事,就是無論我年紀多大,總能和最優秀的年輕人共事。所以,你知道的,我和三位了不起的年輕但世界級的技術專家——Justin Johnson、Ben Mildenhall和Christoph Lassner共同創立了一家科技公司,我們即將嘗試解決在我看來目前AI領域中最困難的問題。
Q:那真是令人難以置信的天賦,我是說,Chris,他是Pulsar的創造者,而Pulsar是Gosh和Splats的雛形,可以進行大量可區分的渲染;你的前學生Justin Johnson擁有超強的系統工程思維,實現了實時神經風格遷移;然后是Ben,他是Nerf的作者。所以這是一支超級精銳團隊,而你需要這樣的一支超級精銳團隊。我們之前稍微聊過,實際上,視覺任務在某些方面比LLM更難——也許這話說出來有些爭議,但畢竟LLMs基本上是一維的,而你談論的是理解三維世界的結構。為什么這會如此困難并且落后于語言的研究呢?
李飛飛:我很感謝你能體會到我們的問題有多困難,哈哈。語言在本質上是一維的對吧?那些音節按照順序排列,這就是為什么序列到序列、序列建模如此經典。還有一些人們沒有意識到的語言方面的東西:語言純粹是生成性的。自然界中不存在語言,你無法觸碰或者看見語言,語言源自每個人的大腦,而這是一種純粹的生成信號——當然,你把它寫在紙上,它就存在了。
但是語言的生成、構建和效用是非常具有創造性的,現實世界遠比這復雜得多。首先,現實世界是3D的。如果加上時間,那就是4D,但就讓我們局限于空間吧,認為世界本質上是3D的,這本身就是一個組合難度更大的問題;
其次,視覺對世界的感知和接收是一種投射,無論是你的眼睛、視網膜還是相機,它總是將3D轉換為2D,你得明白這有多難,從數學角度來說這是錯誤的,這就是為什么人類和動物有很多個傳感器;
第三,世界并非完全是生成性的,我們可以生成虛擬的3D世界,它仍然必須遵守物理規律等等,但外面也有一個真實的世界。現在虛擬世界突然以一種非常流暢的方式在生成和重建之間切換,而且用戶行為、實用性、使用場景都大不相同——如果你把時間撥到這一代,我們就可以談談游戲、元宇宙之類的話題,如果你一路撥入現實世界,你就會發現我們正在談論具身智能等等。但這一切都處于世界建模和空間智能的連續體上。
一個顯而易見卻常被回避的問題是:互聯網上充斥著大量的語言數據,而空間智能的數據在哪里呢?當然,這些信息都存在于人類大腦中,但它不像語言那樣容易獲取,這些都是它如此困難的原因。但坦白說,這讓我興奮,因為如果它很容易,那別人早就解決了。我的整個職業生涯都在追逐那些極其困難、近乎瘋狂的問題,我認為這就是那個瘋狂的問題。
Q:即使從最基本的原理來思考這個問題,人類大腦視覺皮層中處理數據的神經元數量遠多于處理語言的神經元數量,人腦的這種架構與LLMs有很大差別,你也逐漸發現了這一點,對吧?
李飛飛:這實際上是個非常好的問題,現在仍然存在很多不同的觀點,我們在大語言模型中看到的很多內容實際上是在寫作,通過寫作技能將故事擴展到完美的結局,你幾乎可以一路通過暴力手段進行自監督。
而建設性世界模型可能會更復雜一些,世界更加結構化,可能需要我們用來引導它的信號,你可以把它看成一種先驗形式,或者是數據監督。
我認為以上這些是我們必須解決的一些開放性的問題,而且,我們甚至都不能完全理解人類的所有感知,我們還沒有解決3D在人類視覺中如何運作這個問題,雖然從機械原理上,我們用眼睛對物體進行三維測量,但在此之后,數學模型又在哪里呢?
人類并不像3D動物那么偉大,所以還有很多問題有待解答,我只是在指望一件事:我期待我們之中最聰明的人來解決這個問題。
Q:那是否可以認為你們的World Labs正在構建的是全新的基礎模型,它輸出的是3D世界。你們設想的應用有哪些?因為你已經列出了從感知到生成的所有內容,但生成模型和判別模型之間始終存在著矛盾,那么(輸出的)這些3D世界有什么作用呢?
李飛飛:就空間智能而言,就像語言模型一樣,從創作的角度來看這個模型用例非常廣泛,比如,可以當設計師、建筑師、工業設計師,以及藝術家,還有從創作到游戲開發者,再到機器人、機器人學習等方面,空間智能模型或者說是世界模型的實用性非常大。
實際上,我對元宇宙非常感興趣,我知道很多人仍然覺得它不管用,雖然我也知道它仍然無法運作,但我認為硬件和軟件的融合即將到來,這也是未來的另一個絕佳用例。
Q:我個人對于你正在解決元宇宙的問題感到非常興奮,因為我也在之前的公司嘗試過(這個問題)。
李飛飛:我認為硬件是目前元宇宙障礙的一部分,在元宇宙中需要內容生成,而內容生成需要世界模型。
思想上要有無畏精神
Q:對于一些觀眾來說,他們可能會覺得你從學術界到現在成為創始人兼CEO的轉變很突然,但實際上你一生都有著非凡的經歷,這不是你第一次從0到1了,你曾移民到美國時,青少年時期不會說英語的情況下甚至開了好幾年洗衣店,跟我們講講這些經歷是如何塑造現在的你的吧。
李飛飛:我當時19歲,我需要去普林斯頓大學學物理,所以我沒有辦法養家糊口,于是我開了一家還不錯的干洗店,用硅谷的話說,我開始籌集資金。
我曾是創始人、CEO,也曾做過收銀員等。但不管怎樣,我看著你們感到無比興奮,因為你們的年齡差不多只有我的一半,甚至,可能只有我年齡的30%,而你們又如此優秀,你們放手去做想做的事情就好。
在我剛開始當教授的時候,我也不顧很多人的反對,去了那些我是首個計算機視覺教授的學院——雖然我知道,作為一名年輕教授,我本應該去哪些有學術氛圍和資深導師的地方。當然,我也很希望那些地方有資深導師,如果沒有的話,我就開辟自己的道路,闖出自己的一片天,我并不害怕。
后來,我去了谷歌,了解了很多谷歌企業方面的知識,然后在斯坦福大學創辦了一家初創公司。大約在2018年,AI成了一個全人類的問題,人類不斷推動著科技的進步,但是我們不能失去人性,我很在意AI發展進程中的一些積極導向,我想讓AI以人類為中心來造福人類。
于是我回到斯坦福創立了以人為本AI研究院(HAI),并且運營了5年,可能有些人不理解,但我對此感到非常自豪。某種程度上,我覺得自己就是熱愛當企業家。
我喜歡那種一切歸零的感覺,就像站在零點一樣,忘掉過去所做的一切,不在意別人對你的看法,只管埋頭苦干,努力建設,那是我的舒適區。
Q:你還有一個非常了不起的地方,除了你所做的所有令人贊嘆的事情之外,你還指導了很多傳奇的研究人員,比如Andrej Kaparthy、英偉達的Jim Fan、與你共同完成ImageNet的鄧嘉,他們后來都取得了非凡的職業生涯。他們學生時代真正突出的地方是什么?
李飛飛:首先,我是個幸運的人。我認為學生對我而言意義更大,他們真的讓我成為了一個更好的人、更好的老師、更好的研究者。就像你說的,能與這么多傳奇學生共事,真的是我一生的榮幸。
他們非常不同,他們中的一些人是純粹的科學家,試圖埋頭解決一個科學問題;有些人是行業領袖;還有一些人,是最偉大的AI知識傳播者。但我認為有一件事能將它們統一起來。
我鼓勵他們每一個人都思考一下這個問題,這也是我為那些正在招聘的創始人提一些建議,包括我的招聘標準:我尋找的是思想上的無畏精神。
我認為無論你來自哪里,無論我們試圖解決什么問題,都無關緊要。那種勇于接受困難之事、全力以赴并想盡辦法去解決問題的勇氣和無畏精神,是成功人士的核心特質。我從他們身上學到了這一點,而且我真的在尋找具備這種特質的年輕人——作為World Labs的CEO,在招聘時,我會尋找具備這種特質的人。
Q:所以你們也在為World Labs大量招聘。
李飛飛:是的,我們正在招聘工程人才、產品人才、3D人才和生成模型人才。所以,如果你覺得自己無所畏懼,并且熱衷于解決空間智能問題,那就跟我聊聊,或者訪問我們的網站。
通過梯度下降法找到生活最優解
觀眾1:嗨,飛飛,我是你的超級粉絲。我的問題是,二十多年前,您從事過視覺識別方面的工作,如果我想現在開始攻讀博士學位,我應該選擇什么方向,才能成為像你一樣的傳奇人物呢?
李飛飛:雖然我可以說,做任何讓你興奮的事,但我更想給你一個深思熟慮的答案:首先,我認為AI研究已經發生了變化,因為學術界不再擁有大部分的AI資源,這和我那個時代大不一樣了。芯片、算力和數據在學術界的資源配置方面確實非常匱乏。
作為一名博士生,我建議你去尋找那些不用通過更好的計算、更好的數據就能更好解決的問題的團隊,在學術界,我們仍然可以發現一些非常根本性的問題:無論你有多少芯片都能取得很大的進展。
其次,跨學科AI是學術界一個非常令人興奮的領域,尤其是在科學發現方面。有太多學科可以與AI交叉,我認為這是理論方面一個大有可為的領域。
很有意思的是,AI能力已經100%超越了理論:我們不知道如何做、我們缺乏可解釋性、我們不知道如何找出因果關系、我們有太多不理解的事情……所以人們可以繼續推進。
而且這個清單可以一直列下去:在計算機視覺領域,仍然存在一些我們尚未解決的表征問題。另外,小數據也是另一個非常有趣的領域,這些就是可能性。
觀眾2:再次祝賀你獲得耶魯大學的榮譽博士學位,一個月前,我有幸在那里見證了那一刻。我的問題是:在你看來,AGI更有可能統一模型或作為多智能體系統,以統一、單一的形式出現嗎?
李飛飛:你提出這個問題的方式本身就已經是兩種定義了。其中一種定義更具理論性,即如果存在一個智商測試,通過該測試就可定義為AGI;另一個定義則更具功能性,如果它是基于智能體的,它是否具備功能性,能執行哪些任務?
老實說,我也對這個AGI的定義感到困惑。1956年齊聚達特茅斯的AI先驅們,像John McCarthy和Marvin Minsky這樣的人,他們想要解決機器思考的問題。而這是圖靈早在10年前就提出的問題,在那個陳述中,它不是狹義的AI,而是一種智能的表述。
所以我不太清楚如何區分關于AI和這個新詞AGI的定義。對我來說,它們是一回事。但我明白,如今的行業喜歡把AGI稱為超越AI的東西,我對此感到困惑,因為我不知道AGI與AI究竟有何不同。
如果我們說如今AGI的系統比80、70、90年代或其他時期的狹義AI系統表現更好,我認為這只是該領域的發展進程。但從根本上說,我認為AI的規模即智能的規模,我們是要創造出能夠像人類一樣智能,甚至比人類更加智能地思考和做事的機器。
我不知道如何定義AGI,不定義它我就不知道它是否是單一的。你把大腦看作一個整體,但它確實有不同的功能。甚至還有專門的語言區域,有視覺皮層,也有運動皮層。所以我真不知道該怎么回答那個問題。
觀眾3:看到一位女性在這個領域發揮主導作用真的很鼓舞人心。我想問,在AI迅速崛起的當下,你作為一名研究者、教育者和企業家,認為什么樣的人應該攻讀研究生學位?
李飛飛:這是個很棒的問題。這是一個連家長都會問我的問題。我認為研究生階段是你充滿強烈好奇心的4到5年。你被好奇心引領。那種好奇心非常強烈,以至于沒有比這個時期更好的時期來滿足。
讀研究生與創業不同,因為創業不能僅僅靠好奇心來引領,這樣你的投資者會對你發火的。一家有著明確商業目標的初創公司,其中一部分原因是好奇心,但又不只是好奇心。
而對于基層人員來說,解決問題或提出正確問題的好奇心很重要,我認為那些帶著強烈好奇心投身其中的人會享受這四五年研究生時光,即便外界正以光速發展,你依然會感到快樂,因為你在那里追尋著那份好奇心。
觀眾4:你提到開源是ImageNet發展的重要組成部分,而現在,隨著大語言模型的最新發布,我們看到各組織在開源方面采取了不同的做法,有些組織完全采用閉源模式,有些組織則完全公開其整個研究棧,還有些組織處于中間狀態,開放權重或采用限制性許可等類似做法。所以我想問,你如何看待這些不同的開源方法,以及你認為作為一家AI公司,正確的開源方式是什么?
李飛飛:我并不拘泥于你必須開源或必須閉源這種教條。這取決于公司的業務戰略。
例如,Facebook、Meta想要開源的原因很明顯,他們目前的商業模式并不是通過銷售模型來盈利。他們正在利用它來發展生態系統,以便人們來到他們的平臺。所以開源很有意義。
而其他公司通過開源或者閉源賺錢。所以我對這個問題挺開放的。我認為開源應該受到保護,如果公共部門(如學術界)和私營部門都有開源,那對創業生態系統非常重要。我認為應該受到技術保護。
觀眾4:我有一個關于數據的問題:既然你現在正在研究世界模型,你指出了機器學習向以ImageNet為代表的數據驅動方法的轉變,并且你提到互聯網上沒有這種空間數據,它只存在于我們的頭腦中,那么你是如何解決這個問題的呢?你是從現實世界收集這些數據嗎?還是合成數據?還是你相信那些古老的先驗知識呢?謝謝。
李飛飛:你應該加入World Labs,我會告訴你的。
作為一家公司,我沒辦法透露太多,但我承認我們正在采取混合方式,擁有大量數據固然重要,但擁有大量高質量數據同樣重要,說到底,如果不注意數據質量,仍然會出現“輸入垃圾,輸出垃圾”的情況。
觀眾5:在你的書《我看見的世界》中,你談到了作為移民女孩和女性在STEM所面臨的挑戰。我很好奇,你是否有過在工作場所感覺自己是少數群體的時刻,如果有,你是如何克服這種情況或說服他人的?
圖片
李飛飛:感謝你提出這個問題。我想非常謹慎或深思熟慮地回答你,因為我們都來自不同的背景,每個人的感受都非常獨特。其實,我們是什么人都無關緊要,我們所有人都有過感覺自己是少數人群的時刻。
有時這取決于我是誰,有時這基于我的想法,有時候就只是在于我穿的襯衫顏色之類的,但這正是我想要鼓勵大家的地方,我從小來到這個地方,我已經檢驗了這件事情的本質,那就是作為一名移民女性,我幾乎培養出了一種不過度關注此事的能力——和你們每個人一樣,我來這里是為了學習、做事或創造。
在訪談的最后,李飛飛給所有年輕人送上了美好的祝愿:
你們即將踏上一段征程,或者正處于征程之中,你們會有脆弱的時刻,或者遇到奇怪的事情,在創業過程中,我每天都有這樣的感受,有時候我會想,“天哪,我不知道自己在做什么”。但你們只管專注去做,通過梯度下降法找到最優解。
訪談鏈接: https://www.youtube.com/watch?v=_PioN-CpOP0