要有野心!創始人揭秘Claude4誕生:有點玄學,很快接入測謊儀!26年出現單人獨角獸! 原創
編輯 | 云昭
上周五 Claude 4 的發布會上,Anthropic 的 CEO Dario Amodei 與Instagram聯合創始人、Anthropic 首席產品官 Mike Krieger 在 KeyNote 最后進行了一場圍爐對話。
兩個人都是創業公司的創始人,又都參與了同一款 AI 產品的打磨與迭代。對于AI 編程,Anthropic 的產品路線圖將是什么樣子?未來 Claude 的技術走向如何?未來12個月? 兩人都在這次二十多分鐘的談話中,頻頻語出驚人。
有意思的是,作為很早就投身大模型的研發之中,Dario 坦承自己其實沒搞懂所有細節,并強調:模型開發過程中常常有種幾乎是“迷信”的過程,總是在關鍵時刻才能“齊活兒”。
Dario做了一個形象的比喻:做AI就像登上了一艘以相對論速度飛行的太空船。船上一天,地球三天。
同時,Dario 認為,很快就可以通過連接測謊儀來測試 Claude 是否說謊了。Mike 順勢調侃道:現在誰還需要“可解釋性”?用測謊儀就夠了。
再比如,提到多久才會出現單人公司而且估值超過 10 億美元?Dario 不假思索地回答:2026 年。
此外,Dario 還對于 Claude 4 的開發過程、大模型的后訓練擴展定律、MCP 的出圈、大模型和小模型的未來、五年后自己向往回歸生命醫學領域等等,都給出了自己的判斷和期許。
整體上看,猛料可圈可點,建議大家自行收藏細讀。以下是談話全文整理。
1.Claude 4 的誕生有點“玄學”前期都不太行,但某個時刻突然就好了
Mike Krieger :
在節目的尾聲,我想深入探討一下Claude在我們研究方向上的角色,以及開發者接下來可以從Anthropic期待什么。讓我們歡迎Dario回來,進行一對一的對談。歡迎回來,Dario。
Dario Amodei :
大家好,又見面了。
Mike Krieger :
這太棒了,就像是面對整個觀眾席的一對一對話。那么Claude Sonnet 4 和 Claude Opus 4 現在都已經發布了。你對Claude 4模型最興奮的地方是什么?它如何改變了你對未來12個月可能實現目標的看法?
Dario Amodei :
抽象地說,我最興奮的一點是:每當我們有一代新的模型,就意味著可以實現更多新任務。所以,我們還會繼續推出后續的 Claude 模型,可能會有 Claude 4.1,就像我們當初發布 Sonnet 3.5 一樣。我認為我們才剛剛開始挖掘新一代模型的潛力。尤其是在自主性方面,它將比以往走得更遠。你可以“放飛”模型,讓它長時間完成某項任務,這種能力才剛起步。
Dario Amodei :
我對模型在網絡安全任務中的應用越來越感興趣。你可以把網絡安全看作編碼任務的一個子集,但它往往是更高端的那類任務。我覺得我們可能終于達到了應對這類任務的門檻。 另外,作為前生物學家,我也很興奮看到模型在生物醫學和科學研究領域的應用。我認為 Opus 在這些方面會特別強大。
Mike Krieger :
這讓我想起那篇《Machines of Loving Grace》(充滿愛與優雅的機器)。Claude 4如何契合這個技術發展路徑?我常開玩笑說,有人把那篇文章當作隨筆看,我卻把它當成未來幾年的產品路線圖。那么你覺得Claude在這個旅程中扮演什么角色?
Dario Amodei :
其實那像是一份我自己也不知道怎么實現的產品路線圖,我寫完后就說:“好了伙計們,這是你們的任務了。”我們越來越多地在生物領域思考,而軟件正是這個領域的一部分,因為生物研究越來越依賴數據。
十年前我還是生物學家時,數據已經很重要了。現在,我們擁有這些懂得生物學的模型,它們可以幫助寫代碼。如果你是一名計算生物學家,這些模型能大幅加速你的研究。我們也已經有不少客戶在嘗試將這些模型用于這類任務。
Mike Krieger :
我記得我們發布 MCP 后參與的第一個黑客馬拉松,有人把 MCP 接到了一個繪圖儀上。Claude 居然能自己畫圖,看到 Claude “為自己畫畫”真的很好玩。這也說明了 MCP 不只是能連接數字系統,也能連接現實世界。所以我覺得用 Claude 驅動實驗室設備會很有趣。
Dario Amodei :
很快我們就可以通過連接測謊儀來測試 Claude了:“你在說謊嗎?”
Mike Krieger :
誰還需要可解釋性?我們有測謊儀就夠了!你之前提到有個瞬間你覺得Claude寫的內容就像人類寫的一樣。還有其他那種讓你意識到“這模型不一樣了”的突破性瞬間嗎?
Dario Amodei :
我其實沒搞懂所有細節,但在模型發布前幾周,有個同事說:“天啊,這模型居然一擊完成了一個極其復雜的性能優化任務。”以前從來沒有哪個模型做到過。我想說的是,模型開發過程中常常有種幾乎是“迷信”的過程:就算訓練流程早已規劃好,但某些能力總是在最后關頭才“齊活兒”。也許是人們與模型的互動,也許只是最后的微調特別關鍵。每次模型剛上線時,人們都會摸索該怎么用,但某個時刻過后,他們就會說:“哇,這太好用了。”這種魔法,總是在最后一刻發生。
Mike Krieger :
《Creativity Inc》這本書里Ed Catmull也說過,動畫電影也是這樣:上線前兩天還很糟糕,然后突然“開竅”了。我感覺我們做模型也是這樣:前期都不太行,但某個時刻突然就好了,讓人迫不及待地想發布。
Dario Amodei :
這真的沒法用理性解釋。你以為訓練過程是線性的、可預測的,但現實不是這樣。
Mike Krieger :
是啊,完全不是。RL的曲線也沒有告訴你最后一刻會有這種“臨門一腳”。
Dario Amodei :
所有東西都在最后一刻拼到一起了,我也不知道為什么。那才是真正的時刻。
2.朝著更高模型自主性前進
Mike Krieger :
在座的許多觀眾是開發者,我們內部也常有人在討論一個問題:AI越來越強,軟件工程中哪些部分會被它接管?在自主智能體可以執行大量編程任務的世界中,什么會變得更重要?
Dario Amodei :
我跟很多人一樣,幾個月前認真讀了Steve Yegge寫的那篇《初級程序員的復仇》。他以前也寫過類似文章,甚至來拜訪過我們。他對未來的描述比我還要準確:我們正逐步朝著更高模型自主性邁進。
Dario Amodei :
我們經歷過“自動補全”的階段,現在有了所謂的“vibe coding”,而接下來就是“派遣代理人去完成任務”。Claude Code 就是往這個方向發展的,我們也會有其他產品支持這種方式。我們正進入一個開發者可以像“管理車隊”一樣指揮AI代理人工作的世界。但人類仍需參與質量控制,確保AI做的正確、細節到位。
Dario Amodei :
所以,無論是模型本身還是產品界面,開發人機協同的細節會變得極其重要。
Mike Krieger :
這也讓我意識到,工作中那些低效的部分變得更痛苦了,因為它們讓人脫離了“創造的流動”。比如我們花太多時間在跨部門協調和排期上,其實本該投入到“造東西”上。
3.未來1~2年,大模型會成為人類的同行
Mike Krieger :
行業里有無休止的爭論:大模型架構和小模型架構,到底誰才是未來?你因提出“擴展規律”而出名,現在的看法如何?預訓練是否仍然是一切的關鍵?后訓練的作用又如何?
Dario Amodei :
我不談太多細節,但Claude 4系列模型在預訓練和后訓練兩方面都有明顯進展。預訓練的擴展規律依然成立,后訓練也在持續進步,這兩者是互補的。未來我們也會繼續擴大模型規模。這些趨勢彼此疊加,會造成指數級增長,這也是為什么我認為整個進程會非常快。我喜歡Yegge的那篇文章,是因為他幫我說出了我常說的一句話:再過一兩年,這些模型就會成為我們的“同行”。
Mike Krieger :
太瘋狂了,Claude 3.7才是在二月發布的,但感覺像過了一年。
Dario Amodei :
對啊,其實只過了三個月,甚至不到2.5個月。時間在加速。我常打比方說:做AI就像登上了一艘以相對論速度飛行的太空船。你在船上過一天,地球就過兩天,再過一陣,船上一天,地球三天。你要迅速消化更多信息。這就是我們在這趟旅程中的感覺。
4.后訓練:大模型可以管理記憶
Mike Krieger :
這個比喻太貼切了。說到后訓練,我特別興奮的一點是Claude 4加入了“記憶”能力。模型可以管理自己的記憶。這為什么重要?又能實現什么呢?
Mike Krieger :
我再重復一下問題:讓模型管理自己的記憶,并處理長期任務,這為什么很重要?
Dario Amodei 10:35 是的,我們發現這非常有用。比如有一個場景是玩《寶可夢》,模型能記住狀態。但這種能力遠不止用于游戲。對人類來說,我們會寫筆記,會在之后查閱,模型也應該能這樣。有時候我會寫中間文檔、寫演示文稿——這些不可能全靠“記憶緩沖區”完成。 所以模型也一樣:它們需要創建文件、處理文件、加載數據,在內部“無縫處理”這些中間工作。
Dario Amodei : 我們新增的功能之一,是模型能在推理與行動之間交替進行。這些行動有時包括存儲數據、調用數據等。這其實意味著,模型逐漸具備了類似人類的“行為能力”,我認為這是應有的發展方向。
5.安全性和能力可以并行發展MCP就是一個例子
Mike Krieger :
我在使用 Claude 4 時印象最深的一刻,是我們用 Claude Code 創建了一個待辦事項的草稿板,然后看著它一點點處理這些事項。當它想到新的任務時,就添加進去,同時勾掉已完成的、劃掉不再相關的,整個過程特別像人類自己管理工作的方式。它在推理與工具使用上也表現出很強的交織能力。比如今天早上我看到一篇 Max Stories 的文章,說 Claude 在使用一個叫 MCP 的工具時遇到了服務端的速率限制,然后它自己判斷:“哦,我可能觸發了速率限制,我換個方法試試看。”這種邊推理邊補救的能力非常強大。
Mike Krieger :
我想回到“競賽的頂端”這個話題。通常人們會認為安全性和能力是對立的,而你們的觀點恰恰相反,認為這兩者可以并行發展。我覺得這個想法非常鼓舞人心,也是我加入這里的原因之一。能不能談談你們如何理解“頂級競賽”的?
Dario Amodei :
我認為這個觀點既適用于簡單的商業場景,也適用于 AI 的宏大未來方向。我們有不少客戶非常在意他們的模型行為是否可預測、是否可信。這其實和我們長期目標是一致的——確保模型從更宏觀的層面上也能對齊人類意圖。這之間其實存在一種很好的協同效應。每當我們認為合理且負責任的時候,我們都希望把工具分享給社區,比如 MCP 就是個例子。
Dario Amodei :
我自己也驚訝于 MCP 被采納的速度。我們去年 11 月發布它時,反響其實沒那么大。但三四個月之后,它幾乎就成了行業標準。這種感覺就像坐在飛船上離開地球,時間膨脹越來越大。你想想以前像 USB 那樣的標準,90 年代一個標準可能要花幾年時間才能統一,而現在幾個月就可以。
6.AI與神經科學是兩碼事
Mike Krieger :
是的,我跟業內的其他人談 MCP 時,他們都說“別拖慢 MCP 的發展節奏”,雖然也希望有點指導方向,但都覺得 MCP 抓住了關鍵,要確保它成為互操作代理的標準協議。也和“競賽頂端”這個話題有關。我很喜歡你那篇關于可解釋性緊迫性的文章。你有神經科學背景,能談談你怎么看可解釋性與機器智能的共同演進嗎?
Dario Amodei :
十年前,很多人認為神經科學會告訴我們該怎么做 AI。的確,有不少前神經科學家加入了這個領域,不止我一個,一些實驗室負責人也有類似背景。我發現,神經科學確實提供了一些啟發,但并不能直接遷移。你不能說“下丘腦的這個機制可以用來造模型”,我們幾乎是一切從零開始。
Dario Amodei :
有趣的是,反而是我們通過可解釋性技術看進了模型內部,盡管它們和人腦的結構完全不同,但卻在概念層面上有些相似之處。比如,有團隊通過可解釋性研究發現視覺模型中有高頻和低頻信號檢測機制,而幾年后神經科學家在動物大腦中也發現了類似的東西。
Dario Amodei :
比如說,視覺模型會把顏色處理和亮度、邊界處理分開成兩個路徑,這種劃分在現實世界中就很自然,不論是生物學習系統還是人工系統,都會收斂到這些基本概念上。這真的很有趣。
7.一人獨角獸公司會出現在2026年要有野心!
Mike Krieger :
我也很好奇,Circuits 項目未來是否也會對神經科學研究產生影響。那我們來聊聊五到十年的時間跨度——雖然在 AI 領域這幾乎不可能預測。我們現在像是在光速前進,也許五到十年其實就是現實世界中的一年時間。你覺得什么時候會出現第一個只有一個人類員工,但估值達十億美元的公司?
Dario Amodei :
2026 年。
Mike Krieger :
完全認同。那么你有沒有建議給未來一年準備基于 Claude 構建產品的人?該怎么思考前沿構建?
Dario Amodei :
當然有很多具體的建議,但因為我們正經歷“相對論時間膨脹”,一切發展太快,所有細節都可以用一句話總結:要有野心。去構建那些你本來以為做不到的東西。即使現在做不出來,下一個版本的模型可能就能實現了。目前模型發布的節奏是三個月一次,也許很快會變成兩個月、一個月,甚至未來你早上剛構建的東西,晚上發布的新模型就已經把它淘汰了。
Mike Krieger :
我認識一位創業者,兩年前開始做 AI 編程代理,他試了所有模型都沒成功。直到 Claude 3.7,他說“我創業的點現在終于能實現了。”就像他之前一直很難,但現在突然就變成可能了。
Dario Amodei :
有時候“撞墻”反而有幫助,你把其他所有部分都準備好了,就等模型到位。一旦模型成熟,你的產品就會非常扎實,可能比實際需要的還強。這種超額設計反而變成了優點。所以雖然我開玩笑說“等等下一代模型”,但如果你做的事情已經“差不多快能實現了”,那繼續堅持是值得的。
Mike Krieger :
我們在內部做前沿研究時也有類似經歷,我們的研究團隊做出一個原型,但模型當時不擅長用工具。直到 Claude 3.7 出來,特別是在研究場景中它的表現非常出色。而正是我們之前那些“失敗的嘗試”鋪墊了這次成功。
Dario Amodei :
確實,有點像你應該把自己的創業項目當成是對“下一個模型”的投機性執行(speculative execution)。像是……
8.接下來的一到五年:軟件開發成本降到幾毛錢
Mike Krieger :
我太喜歡這個說法了,完全正確。那么最后一個問題,對于我們大多數人來說,現在 AI 的發展遠超預期。你對未來一年,乃至五年最感興趣的是什么?
Dario Amodei :
未來一年,我覺得我們會在代碼領域看到非常驚人的進展。從 Claude Code 到基于代理的系統,軟件的生產成本會急劇下降。過去,只有你預期有幾萬人、幾十萬人用,才會去開發一款軟件。但未來,當軟件開發成本降到幾毛錢,你可能就會臨時做一個小工具,用在某個會議或某個活動上。軟件可以按需生成,幾秒鐘、一美元以內搞定,整個世界會變得很不一樣。
Dario Amodei :
那時候開發者的角色是什么?企業和創業公司的角色又是什么?最終用戶的體驗又該如何?這些我們還都不知道。
Dario Amodei :
至于五年后,我又回到生物醫學領域。雖然這一年不會有太多革命性變化,但我希望五年后我們能攻克一些今天仍然存在的重大疾病。
Mike Krieger :
太棒了,我們就以這個美好的愿景收尾吧。時間關系我們得結束了,其實我感覺還能聊上 40 分鐘。非常感謝 Dario 今天和我們分享!
Mike Krieger :
也感謝現場和線上觀眾的參與。差點忘了一個好消息——作為對大家參加 Code with Claude 線下活動的特別感謝,我們將為每位到場觀眾提供 Claude Max 20x(最高等級套餐)三個月免費使用資格,請留意后續通知。
Mike Krieger :
我個人也很喜歡在 Claude Code 上使用 Max 套餐,期待看到你們構建出的精彩作品。祝你們今天在各個分會場玩得開心,再次歡迎大家來到 Code with Claude!
Dario Amodei :
謝謝大家的到來!
ok,文章到這里就結束了,各位看完有何感想呢?歡迎評論區交流。
參考鏈接:??https://www.youtube.com/watch?v=EvtPBaaykdo??
本文轉載自??51CTO技術棧??,作者:云昭
