Claude團隊：用400萬條對話分析AI對經濟的長期影響

作者：量子位 2025-02-12 09:10:00

人工智能新聞

來自創始人Dario Amodei在今年一月底的一次訪談，他透露Anthropic正在開發一些新的大模型，有望在未來3-6個月內發布。

基于400萬條Claude真實對話數據，Anthropic重磅發布全新報告！

在今天，哪些職業用AI最多？他們都用AI干什么？

這些有關AI在各經濟領域應用情況的問題，報告用實實在在的統計數據全回答了。

這一次，他們不僅推出The Anthropic Economic Index（用來理解AI對經濟影響的指數），還公開了第一篇論文，里面包含大量觀察結論：

目前AI使用場景最多的是軟件和寫作；
AI應用也呈現出“二八定律”，約4%的職業在75%的任務中高度使用AI；
是否使用AI與經濟水平高度相關，中高收入最為普遍，最高和最低都要低得多；
當前AI更多承擔輔助功能，不過自動執行任務已經漸趨成熟（43%）；

……

與此同時，Anthropic宣布開源上述用于分析的數據集，以方便其他研究人員進一步得出發現。

報告一經發布，迅速引起熱議。

看完上述消息，網友們終于舒了一口氣！

AI對經濟的影響，總算不用全靠猜測了。

AI還只是某種選擇而非必需品

還是先來看第一篇公開論文的具體內容。

概括而言，通過對Claude平臺400萬+匿名對話數據的分析，Anthropic構建起了衡量AI在經濟活動中使用模式的框架，以此揭示AI在不同任務、職業中的應用情況，并最終探討了其對經濟的影響。

展開來說，如下圖框架所示，研究團隊使用Clio工具（Anthropic開發的自動化分析工具）對大量對話進行分析，目標是將對話映射到職業類別上。

由于美國勞工部ONET數據庫包含近20,000個獨特的任務陳述，導致直接分類難度較大，因此研究人員構建了一個分層的任務樹結構。

也就是說，先由Claude篩選出職業相關對話，接著借助樹狀搜索，讓Claude依據對話內容從任務層次結構頂層向下遍歷選擇，最終完成對話與具體ONET任務的映射。

而根據上述映射和分析，研究發現了AI在不同職業類別中的使用差異。

首先，由于軟件開發、數據分析等工作高度適配AI技術，因此計算機和數學相關職業的AI使用率最高，占所有查詢的37.2%，整體TOP 6如下：

與之相反，偏傳統的農林牧漁行業與AI最遠。

進一步分析不同職業的AI使用深度，可以看出，約36%的職業在四分之一任務中會使用AI，而僅有約4%的職業會在四分之三任務中使用。

換句話說，少部分人大量使用AI，大多數人采取“適量”姿態，整體上AI還只是一種選擇而非必需品。

其次，收入情況也和AI使用率息息相關。

數據顯示，AI在中高收入的工作中（如程序員）使用最為普遍；低收入（如服務員）和非常高收入（如麻醉師）的工作中AI使用率則又要低得多，呈現中間多、兩邊少的形態。

接下來，研究觀察了人們更喜歡與AI協作，還是讓AI自動化執行任務。

結果發現人機協作仍占據主位，約占57%；不過以智能體為代表的自動化執行也不容小覷，目前已經占比43%。

這也意味著，“2025屬于Agents（智能體）”這句話的含金量還在上升。

BTW，Anthropic這次還透露了Claude 3.5 Sonnet和Claude 3 Opus模型之間的任務使用模式的比較分析。

顯而易見，最新模型Sonnet 3.5被更多用于編碼和技術任務，而Opus更多用于創意寫作和教育內容開發。

以上為論文主要發現。另外值得一提的是，官方還特意強調了分析所存在的局限性。

無法確定所有這些任務都是在工作中完成；
人們可能從不同途徑使用Claude，（當前僅統計官方平臺）協同使用這一項可能被低估；
由于Claude不支持圖片生成，可能遺漏部分重要使用場景。

不過接下來，Anthropic將繼續推進這一研究。對此，他們同步公開了上述分析所使用的數據集，并邀請經濟學家、政策專家和研究人員開展合作。

而且還順勢搞了波招聘，為公司社會影響團隊招研究科學家和研究工程師。

全網催更Claude新模型

除了討論報告本身，保留節目是，網友們紛紛借此開啟了催更模式。

Sonnet 4怎么還不來？？

更有網友犀利辣評，Anthropic將發布除新模型之外的一切。(doge）

回顧Anthropic更新Claude模型的頻率，不難發現新模型可能要等到今年上半年。

（表格由AI整理，內容經過驗證）

更具體的說法，來自創始人Dario Amodei在今年一月底的一次訪談，他透露Anthropic正在開發一些新的大模型，有望在未來3-6個月內發布。

嗯，保守估算一下，也就是今年5~8月份了。

另外他當時還劇透了，新模型會采取不同于其他公司的策略，讓推理能力與模型的其他能力更加協調統一。

正在開發的還有一個“虛擬協作者”（Virtual Collaborator）。

這是一個可以在計算機上執行各種任務（如寫代碼、測試、交流、撰寫文檔等）的AI系統，用戶可以與它進行長時間的任務導向交互。

至于圖像和視頻生成則不是Anthropic的研發重點，未來如果確有必要的話，也會選擇“拿來主義”，與專業的圖像生成公司合作。

那就狠狠期待一波了~

責任編輯：張燕妮來源：量子位

AI 模型數據

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Claude團隊：用400萬條對話分析AI對經濟的長期影響

AI還只是某種選擇而非必需品

全網催更Claude新模型