本科畢業加入谷歌,還寫了「思維鏈」開山之作,這位OpenAI新秀正為本科生答疑解惑
如果你仔細研究過「chain of thought(CoT)」這個概念,那么你大概聽過 Jason Wei 這個名字。
圖片
他是思維鏈概念開山之作 ——「Chain-of-Thought Prompting Elicits Reasoning in Large Language Models」的第一作者,本科畢業就加入了谷歌。在那里,他推廣了思維鏈提示概念,共同領導了指令調優的早期工作,并和 Yi Tay、Jeff Dean 等人合著了關于大模型涌現能力的論文。
圖片
Jason Wei 等作者對思維鏈的定義是一系列的中間推理步驟,目的是為了提高大型語言模型進行復雜推理的能力(通過將一個較為復雜的推理問題分步拆解,一步步獲得最終答案)。Jason Wei 等人的論文是第一篇發現當使用鏈式思維進行提示時,存在一個相變現象,表明大型模型在很大程度上優于較小的模型,這進一步導致了涌現能力的發現(引自《復雜推理:大語言模型的北極星能力》)。目前,思維鏈提示已經在大模型領域得到廣泛易用。
2023 年初,他選擇加入 OpenAI,與其他技術人員一起構建 ChatGPT。
憑借這些硬核的學術成果,Jason Wei 的被引量已經接近 8000。
圖片
作為一位年輕的學術新星,Jason Wei 最近收到了很多問題。這些問題大部分來自本科生,代表了他們對早期學術生涯的一些困惑。在一個 google 文檔中,Jason Wei 回答了其中一些。本文摘取了其中幾個問題,希望對抱有同樣困惑的同學有所幫助。
圖片
問:你在 AI 領域的旅程是如何開始的?
答:雖然你是通過我 2022 年的工作認識我的,但我從 2017 年開始就一直在從事 AI 領域的工作。
在達特茅斯學院讀本科時,我最初想成為華爾街的銀行家,這是我父母那一代的美國夢(也是我家鄉大多數朋友的選擇)。但是我在大一的時候(2017 年)很難找到金融實習機會,所以最后,我通過我媽媽的朋友結識了一家 AI 創業公司,然后和這家公司展開了合作。
那個夏天,我通過閱讀 Michael Neilson 的《神經網絡與深度學習》第一次接觸了 AI。我了解了反向傳播算法,從任何類型的輸入和輸出數據中學習任意映射的想法吸引了我。我至今還記得,我對這個領域的熱情比我在學校學過的其他任何學科都要高出一個數量級。
2010 年代末流行發論文,所以我也在大學期間試圖這么做。我走了一條普通的路,參加了一門機器學習課程,并請求教這門課的教授指導我進行研究。我在醫學圖像分析的深度學習領域工作了兩年。我的研究成果還不錯,但也并非驚艷。達特茅斯學院沒有充滿活力的 AI 環境,很難找到志同道合的社區。所以我真的很感激那里真正對 AI 感興趣的少數幾個人,其中 Sam Greydanus 是我仰慕的人。
畢業臨近時,我同時申請了博士學位和軟件工程師職位。我有一篇被一家重要學術會議接受的優秀論文,以為我會被所有的博士學位項目錄取。結果,幾乎所有學校都拒絕了我,除了南加州大學(USC)。大三的暑假,我在 Blend 和 DoorDash 實習,但我不是一個出色的軟件工程師,對軟件也沒有那么大的熱情。
我差點就去南加州大學攻讀博士學位,但后來我改變了主意,因為我獲得了 Google AI Residency 項目的邀請,這是一個為沒有 AI 博士學位的人提供谷歌研究機會的項目,為期 18 個月。這個 AI 項目可能是我職業生涯迄今為止最大的跳板。我可能是憑借我寫的關于自然語言處理中數據增強的一篇相對受歡迎的論文被錄取的。那篇論文的影響對我來說是個驚喜 —— 我天真地將我在醫學圖像分析中使用的一種直覺應用到了自然語言處理中,沒想到它會變得如此受歡迎。
因此,在 2020 年畢業后,我在谷歌工作了兩年多,從事大型語言模型研究。谷歌是一個進行研究的絕佳場所,許多著名的研究人員通過在谷歌的工作樹立了自己的聲譽。這個 AI 項目特別有效,因為表現優秀的研究人員有機會繼續留在谷歌工作,大多數人都會為了能夠成為永久員工而努力。
我的故事至少包含兩個教訓,雖然都有些老生常談,但我還是想說一下:
- 第一,很多我當時認為是失敗的事情實際上對我來說是好事。如果我當初在金融或軟件工程實習方面更加成功,可能就錯過了我現在喜歡的 AI 職業生涯。
- 第二,運氣起到了很大的作用,但我也創造了很多機會來獲得好運。例如,我在撰寫一篇被廣泛引用的自然語言處理論文方面并沒有絕對的優勢,但通過寫一篇關于它的博客,使用通俗易懂的語言,并在線上提供代碼,我為這篇論文贏得了受歡迎的機會。
問:我應該選擇哪個研究方向?
答:顯然,這個問題沒有一個標準答案。
我個人認為,選擇一個你喜歡的研究方向很重要,因為從長遠來看,你會在這方面做得更好。如果你不知道自己喜歡什么樣的研究,可以廣泛閱讀幾周,或者詢問他人他們對哪些方向感興趣,然后選擇一個開始進行研究。
有時候,你可能需要在你想要從事的研究方向和其他因素之間做出權衡。例如,你可能有機會與一位優秀的教授合作,但研究方向可能并非你首選的主題。我認為,如果你能從中學到很多東西,或者它能幫助你實現自己的目標,這樣做是可以接受的。但重要的是要記住你做事情的原因,并且對自己的意愿保持透明。
有一個研究方向,我會一概推薦給人們考慮,那就是「對齊」(alignment)。我認為「對齊」是一個很好的方向,有幾個原因支持這個看法:
- 將智能 AI 與人類價值觀對齊顯然非常重要。
- 對齊是一個相對新興的領域,因此早期從事對齊研究的人將有更大的機會產生影響。
- 對齊可能涉及多個學科,與倫理學等其他領域有關,這可能會吸引一些人。
- 對齊研究人員的供應少于需求,所以找到工作可能會更容易。
有一些人不從事對齊研究可能是因為這不是傳統的研究方向,缺乏很好的基準,不太容易入門。而且,對齊的目標并未得到所有人的一致認同。但我不認為這些原因會成為障礙;我發現從事對齊研究的人非常樂于和那些對對齊感興趣的人交流。
問:你大部分需要進行有效研究的知識是從哪里學來的?如果有有趣的想法,是花更多時間學習,還是直接開始研究?
答:在研究中,有三種學習來源:
- 閱讀資料:其他研究論文、博客文章、推特等。
- 其他人告訴你:你的導師給你反饋,審稿人審查你的論文。
- 你嘗試做一些事情:你進行一項實驗,它有可能成功,也有可能失敗,你要深入挖掘原因。
在開始階段,閱讀資料是很有益的,因為進行第二和第三種學習會有更高的成本(涉及到他人的時間和你自己進行實驗所需的時間)。然而,你很快就希望盡早開始第二和第三種學習。原因是,當你處于能力的邊界時,學習發生得最快,而且由于(2)和(3)是為你個性化定制的,它們將更快地加速你的學習過程。
問:你認為進行研究最重要的特質是什么?
答:我認為研究,就像其他大多數技能一樣,可以通過實踐來學習(參見:https://www.jasonwei.net/blog/practicing-ai-research)。我們當中很少有人能達到陶哲軒那種天賦水平。但我相信大多數人都有能力成為高水平的研究人員。因此,對于這個問題,我的簡短回答可能是「毅力」,因為毅力能夠促進實踐。
在研究中被嚴重低估的一個技能是從反饋中學習。你會驚訝于人們對反饋的忽視程度 —— 我發現大多數向我尋求建議的人并不聽取意見。我嘗試非常認真地對待別人給出的反饋,如果他們是行業的佼佼者更是如此。反饋就像是一個梯度,它告訴你成為更好的研究人員應該往哪個方向前進。當我有導師時,我每周都會向他們詢問我可以做得更好的地方,然后努力去做。在研究中,我們很幸運有著快速的反饋循環文化;并不是每個領域都是如此。
需要注意的是,我們也要懂得在何時忽略反饋。你的導師或老板在提供反饋時可能并不總是處于適宜的精神狀態,而且他們對你的問題可能沒有像你那樣深入思考。但你仍然應該仔細考慮他們說的話。
另一個被低估的技能是愿意做一些基礎性的工作,特別是查看數據。2019 年,我訓練了一種用于肺癌分類的神經網絡,我對大部分數據進行了初步標注,然后請病理學家審查我的分類。這花費了我 40 多個小時,最后我能夠像臨床病理學家一樣對某種類型的肺癌進行分類。雖然花費了很多時間,但我從進行數據標注中獲得的直覺在此后的三篇論文中都得到了應用,所以這是值得的。
研究中最后一個被低估的技能是成為一個良好的溝通者。良好的溝通使你更值得信賴,值得合作。例如,我有三個小忌諱,其他人可能也有:
- 很多人喜歡說「我明天把這個活兒干完」,然后事實上要等到幾周后才完成。我盡量避免說這樣的話,除非確實很重要,而且我確實能在明天之前完成(不只是開始做)。我希望在他人需要完成一項重要任務時,他們能相信我的承諾。
- 在項目的初期會議中,人們常常表現出很大的興趣參與,但后來卻不愿意付出與他們表達的興趣成比例的時間。同樣,我希望我的興趣對他人有所提示,所以我盡量說一些類似于「我不能保證會參與這個項目,但是 <X> 的想法對我來說真的很有趣」的話。
- 人們經常會說「<X > 不起作用」,卻沒有提供足夠的細節。我試圖把陳述改成「在使用公式 F、模型 M 和數據集 D 時,<X > 沒有起作用」,這樣可以減少對方猜測我所說的具體內容的心力消耗。
問:有效的想法(至少在你從事的領域)是否更傾向于在數學上有更深的內涵,還是更具廣泛的創造力?如果數學深度很重要,在本科階段如何達到這種理解水平?是培養良好的數學直覺更重要,還是值得花時間深入研究這些數學主題?
答:很難說學更多數學知識是不好的,但我有點個人想法:在深度學習的歷史中,有兩個簡單的因素經得起時間的考驗,并且幾乎總是有效的:更大的模型和更多的數據。這兩者都不涉及深奧的數學基礎,甚至不算特別具有創造性。
因此,我不建議在數學上過于深入,原因有幾點:
- 目前在這個領域存在著很多機會和未開發的想法,這意味著時間的機會成本很高。因此,投入時間在數學上的相對價值較低。
- 即使你想花更多時間來培養長期技能,我認為有些能力比擅長數學更有優勢。以下是一些建議:
- 當今的人工智能領域在很大程度上與精通工程和發展良好的軟件工程技能有關。
- 當前的瓶頸之一是 GPU,了解硬件以及如何高效使用 GPU 可能比學習數學更具回報。
- 努力成為一名優秀的溝通者,會讓你更容易與人共事,幫助你更清晰地思考,更有條理。
鑒于大多數想法并非源于數學動機(雖然也有一些),在尋找工程解決方案時,過度依賴數學知識可能會使你產生錯誤的偏見(就像精通語言學并不能幫助你建立大型語言模型一樣)。
目前,這個問答帖還在更新,Jason Wei 也在陸續貢獻自己的答案,大家可以有選擇性地借鑒,或者提出自己的新問題。
完整文檔參見以下鏈接:https://docs.google.com/document/d/1QREmdzLwJ0CR3kdFeenJbBowT1IFFREd46y10tW6pog/edit