從聊天機器人到協作伙伴:智能體如何重塑企業工作模式
Scott White仍然對AI從一種新奇事物迅速轉變為真正的工作伙伴感到驚嘆。就在一年多前,Anthropic公司的Claude AI產品負責人White還見證著早期的AI編碼工具幾乎無法完成一行代碼,而如今,盡管他并非專業程序員,卻也在親自構建可用于生產的軟件功能。
“我不再將自己的工作視為編寫產品需求文檔(PRD)并試圖說服他人去做某事,”White表示,“我首先做的是,能否在我們的預發布服務器上構建一個可行的原型,然后分享一個它實際工作的演示。”
這一轉變代表了企業在采用AI方面的更廣泛變革,從簡單的問答聊天機器人邁向能夠自主工作的復雜“智能體”系統。White的經歷為數百萬其他知識工作者揭示了未來可能發生的情景。
從代碼補全到自主編程:AI的飛速進化
這一進化過程異常迅速。當White加入Anthropic時,公司的Claude 2模型還能只能處理基本的文本補全。Claude 3.5 Sonnet的發布使得創建整個應用程序成為可能,進而催生了如Artifacts這樣的功能,讓用戶能夠生成自定義界面。現在,Claude 4在SWE-bench編碼基準測試中取得了72.5%的成績,該模型能夠勝任White所說的“完全遠程的智能體軟件工程師”角色。
Claude Code是該公司最新的編碼工具,能夠分析整個代碼庫,搜索互聯網上的API文檔,發起拉取請求,回應代碼審查評論,并迭代解決方案——所有這些都能異步工作數小時。White指出,Claude Code本身的90%都是由這個AI系統編寫的。
“這就像是一個完整的智能體流程在后臺運行,這在六個月前還是不可能的。”White解釋道。
企業巨頭利用智能體將工作時間從數周縮短至數分鐘
這一影響遠遠超出了軟件開發領域。丹麥制藥巨頭諾和諾德已將Claude集成到之前需要10周才能完成的臨床報告工作流程中,現在同樣的工作僅需10分鐘。GitLab利用該技術處理從銷售提案到技術文檔的所有事務。Intuit則部署Claude直接向消費者提供稅務建議。
White區分了AI集成的不同層次:回答問題的簡單語言模型、配備網絡搜索等增強工具的模型、將AI融入業務流程的結構化工作流,以及能夠使用多種工具和迭代推理自主追求目標的全智能體。
“我認為智能體是有目標的,然后它可以做很多事情來實現這個目標,”White說。關鍵在于他所說的模型智能與新產品能力之間“不可避免的”關系。
基礎設施革命:構建AI協作者網絡
一項關鍵的基礎設施發展是Anthropic的模型上下文協議(MCP),White將其描述為“集成的USB-C接口”。與其讓每家公司為每個數據源或工具建立單獨的連接,MCP為AI系統提供了一種標準化的方式來訪問企業軟件,從Salesforce到內部知識庫。
“這真正實現了數據訪問的民主化,”White說,并指出通過這一開源協議,一家公司建立的集成可以被其他公司共享和重用。
對于希望實施AI智能體的組織,White建議從小處著手,逐步構建。“不要試圖從頭開始構建一個完整的智能體系統,”他建議道,“先構建其中的一個組件,確保該組件工作正常,然后再構建下一個組件。”
他還強調了評估系統的重要性,以確保AI智能體按預期執行。“評估就是新的產品需求文檔,”White說,他指的是產品需求文檔,強調公司必須開發新的方法來評估AI在特定業務任務上的表現。
從AI助手到AI組織:下一個勞動力前沿
展望未來,White設想AI開發將變得對非技術工作者也觸手可及,類似于編碼能力的進步。他想象了一個未來,個人不僅管理一個AI智能體,而是管理由多個專業化AI系統組成的整個組織。
“每個人如何成為自己的迷你首席產品官(CPO)或首席執行官(CEO)?”White問道。“我并不完全清楚那會是什么樣子,但這就是我醒來并想要實現的目標。”
White所描述的轉變反映了更廣泛的行業趨勢,隨著公司應對AI不斷擴展的能力,早期采用主要集中在實驗性用例上,而企業現在正越來越多地將AI集成到核心業務流程中,從根本上改變了工作的完成方式。
隨著AI智能體變得更加自主和有能力,挑戰從教授機器執行任務轉變為管理能夠長時間獨立工作的AI協作者。對White來說,這個未來已經在到來——每次生產一個功能特性。