Claude團隊:用400萬條對話分析AI對經濟的長期影響
基于400萬條Claude真實對話數據,Anthropic重磅發布全新報告!
在今天,哪些職業用AI最多?他們都用AI干什么?
這些有關AI在各經濟領域應用情況的問題,報告用實實在在的統計數據全回答了。
這一次,他們不僅推出The Anthropic Economic Index(用來理解AI對經濟影響的指數),還公開了第一篇論文,里面包含大量觀察結論:
- 目前AI使用場景最多的是軟件和寫作;
- AI應用也呈現出“二八定律”,約4%的職業在75%的任務中高度使用AI;
- 是否使用AI與經濟水平高度相關,中高收入最為普遍,最高和最低都要低得多;
- 當前AI更多承擔輔助功能,不過自動執行任務已經漸趨成熟(43%);
……
與此同時,Anthropic宣布開源上述用于分析的數據集,以方便其他研究人員進一步得出發現。
報告一經發布,迅速引起熱議。
看完上述消息,網友們終于舒了一口氣!
AI對經濟的影響,總算不用全靠猜測了。
AI還只是某種選擇而非必需品
還是先來看第一篇公開論文的具體內容。
概括而言,通過對Claude平臺400萬+匿名對話數據的分析,Anthropic構建起了衡量AI在經濟活動中使用模式的框架,以此揭示AI在不同任務、職業中的應用情況,并最終探討了其對經濟的影響。
展開來說,如下圖框架所示,研究團隊使用Clio工具(Anthropic開發的自動化分析工具)對大量對話進行分析,目標是將對話映射到職業類別上。
由于美國勞工部ONET數據庫包含近20,000個獨特的任務陳述,導致直接分類難度較大,因此研究人員構建了一個分層的任務樹結構。
也就是說,先由Claude篩選出職業相關對話,接著借助樹狀搜索,讓Claude依據對話內容從任務層次結構頂層向下遍歷選擇,最終完成對話與具體ONET任務的映射。
而根據上述映射和分析,研究發現了AI在不同職業類別中的使用差異。
首先,由于軟件開發、數據分析等工作高度適配AI技術,因此計算機和數學相關職業的AI使用率最高,占所有查詢的37.2%,整體TOP 6如下:
與之相反,偏傳統的農林牧漁行業與AI最遠。
進一步分析不同職業的AI使用深度,可以看出,約36%的職業在四分之一任務中會使用AI,而僅有約4%的職業會在四分之三任務中使用。
換句話說,少部分人大量使用AI,大多數人采取“適量”姿態,整體上AI還只是一種選擇而非必需品。
其次,收入情況也和AI使用率息息相關。
數據顯示,AI在中高收入的工作中(如程序員)使用最為普遍;低收入(如服務員)和非常高收入(如麻醉師)的工作中AI使用率則又要低得多,呈現中間多、兩邊少的形態。
接下來,研究觀察了人們更喜歡與AI協作,還是讓AI自動化執行任務。
結果發現人機協作仍占據主位,約占57%;不過以智能體為代表的自動化執行也不容小覷,目前已經占比43%。
這也意味著,“2025屬于Agents(智能體)”這句話的含金量還在上升。
BTW,Anthropic這次還透露了Claude 3.5 Sonnet和Claude 3 Opus模型之間的任務使用模式的比較分析。
顯而易見,最新模型Sonnet 3.5被更多用于編碼和技術任務,而Opus更多用于創意寫作和教育內容開發。
以上為論文主要發現。另外值得一提的是,官方還特意強調了分析所存在的局限性。
無法確定所有這些任務都是在工作中完成;
人們可能從不同途徑使用Claude,(當前僅統計官方平臺)協同使用這一項可能被低估;
由于Claude不支持圖片生成,可能遺漏部分重要使用場景。
不過接下來,Anthropic將繼續推進這一研究。對此,他們同步公開了上述分析所使用的數據集,并邀請經濟學家、政策專家和研究人員開展合作。
而且還順勢搞了波招聘,為公司社會影響團隊招研究科學家和研究工程師。
全網催更Claude新模型
除了討論報告本身,保留節目是,網友們紛紛借此開啟了催更模式。
Sonnet 4怎么還不來??
更有網友犀利辣評,Anthropic將發布除新模型之外的一切。(doge)
回顧Anthropic更新Claude模型的頻率,不難發現新模型可能要等到今年上半年。
(表格由AI整理,內容經過驗證)
更具體的說法,來自創始人Dario Amodei在今年一月底的一次訪談,他透露Anthropic正在開發一些新的大模型,有望在未來3-6個月內發布。
嗯,保守估算一下,也就是今年5~8月份了。
另外他當時還劇透了,新模型會采取不同于其他公司的策略,讓推理能力與模型的其他能力更加協調統一。
正在開發的還有一個“虛擬協作者”(Virtual Collaborator)。
這是一個可以在計算機上執行各種任務(如寫代碼、測試、交流、撰寫文檔等)的AI系統,用戶可以與它進行長時間的任務導向交互。
至于圖像和視頻生成則不是Anthropic的研發重點,未來如果確有必要的話,也會選擇“拿來主義”,與專業的圖像生成公司合作。
那就狠狠期待一波了~