1年智能體落地,3年獲普利策獎(jiǎng),6年或引發(fā)危機(jī)!Django之父6大預(yù)測(cè)
AI發(fā)展日新月異,可謂「亂花漸欲迷人眼」,很難預(yù)測(cè)未來的世界到底如何。
而Web框架Django之父Simon Willison,這一次他走出舒適區(qū),大膽跨界預(yù)測(cè)未來AI發(fā)展趨勢(shì)!
在近日的播客中,他預(yù)測(cè)了未來1、3、6年不同階段的AI發(fā)展以及可能的結(jié)果。
參加完播客之后,Simon Willison把對(duì)未來的預(yù)測(cè)擴(kuò)展為博客文章。
主要預(yù)測(cè)如下:
1. 一年內(nèi),除了編程和科研智能體,其他智能體難以落地。
2. 三年內(nèi),某人將在GenAI工具輔助下,拿下普利策獎(jiǎng);在日常工作,記者熟練利用LLM,處理數(shù)據(jù);在個(gè)人數(shù)據(jù)保護(hù)上,法律取得實(shí)質(zhì)性進(jìn)展。
3. 六年后,AI將簡(jiǎn)化藝術(shù)創(chuàng)作,解放人類的藝術(shù)創(chuàng)意。但如果AGI取代大部分人類的工作,可能會(huì)引發(fā)大規(guī)模社會(huì)動(dòng)蕩,后果不堪設(shè)想。
一年內(nèi)智能體預(yù)測(cè):第一部分
在2024年,Simon評(píng)論到「智能體」還沒有真正發(fā)生。
Simon認(rèn)為,在2025年將看到更多關(guān)于智能體的炒作,但結(jié)果將讓大多數(shù)「智能體」的粉絲感到失望。
在智能體(Agent)上,Simon預(yù)見將有大量資金被白白浪費(fèi)。
「旅行智能體」不會(huì)成功
如果問十個(gè)人,你會(huì)得到十個(gè)稍微不同的答案——Simon收集并用AI總結(jié)了不同的答案。
鏈接:https://gist.github.com/simonw/beaa5f90133b30724c5cc1c4008d0654
為了簡(jiǎn)化論證,Simon選了一個(gè)他認(rèn)為不會(huì)實(shí)現(xiàn)的定義:可以代表用戶去半自主行動(dòng)的AI助手。
Simon把這個(gè)定義稱為「旅行智能體」式的智能體,因?yàn)楫?dāng)描述「智能體」時(shí),不知為何,人們總會(huì)聯(lián)想到預(yù)定航班、酒店以及規(guī)劃行程。
讓當(dāng)前的LLM做出重要決策——比如花錢買什么——是一個(gè)非常糟糕的主意。
它們不可靠,但更重要的是,它們太容易受騙了。
如果你給AI助手一張信用卡,并放任它的行動(dòng),你要確保,在第一個(gè)聲稱提供最佳優(yōu)惠的網(wǎng)站上, 它不會(huì)馬上點(diǎn)擊「購買」按鈕!
因?yàn)辄c(diǎn)擊一下「購買」,就能把你的銀行賬戶信息轉(zhuǎn)給黑客,從而掏空你的「錢包」。
而現(xiàn)在還無法避免這一點(diǎn)。
之所以還沒有看到LLM驅(qū)動(dòng)的智能體,就是因?yàn)榭煽啃浴?/span>
Simon對(duì)這點(diǎn)深信不疑,盡管自從ChatGPT首次發(fā)布以來,這個(gè)想法就吸引了大量關(guān)注。
接下來的12個(gè)月,發(fā)布的模型中,只要有一個(gè)能完全避免這一點(diǎn),Simon都會(huì)喜出望外。
因?yàn)樗J(rèn)為解決受騙問題非常難,難得出奇。
一年內(nèi):編程和科研智能體行得通
Simon相信有兩類「智能體」確實(shí)可行,而且事實(shí)已經(jīng)證明它們確實(shí)有效。
編程助手
第一類是編程助手——讓LLM寫代碼、執(zhí)行并根據(jù)結(jié)果修改代碼,不斷循環(huán)。
在2023年3月或4月,Simon第一次看到這種模式:OpenAI用Code Interpreter演示了這一點(diǎn)。
ChatGPT可以利用Python解決問題:它會(huì)編寫代碼,并在安全沙箱中(可能是Kubernetes)執(zhí)行代碼,然后根據(jù)輸出或錯(cuò)誤信息判斷目標(biāo)是否已達(dá)到。
這種模式非常好,在2023年初的模型(最初使用的是GPT-4)中效果非常好,今天依然如此。
在同年10月,Claude也發(fā)布了自己的版本(Claude Analysis,使用在瀏覽器中運(yùn)行的JavaScript),Mistral和Gemini也有類似的功能,還有許多其他工具實(shí)現(xiàn)了相同的模式。
科研助手
第二類智能體是科研助手——LLM能夠多次搜索,收集信息,并將其整合成答案或者撰寫報(bào)告。
在這一領(lǐng)域,Perplexity和ChatGPT Search已經(jīng)運(yùn)作了一段時(shí)間,但Simon印象最深刻的是Google Gemini的Deep Research工具。
比如,他向Deep Research提出這樣的問題:
Pillar Point Harbor是北美西海岸最大的棕色鵜鶘棲息地之一。
找到其他的棲息地。
Gemini會(huì)起草計(jì)劃,利用、谷歌搜索訪問幾十個(gè)網(wǎng)站,然后整合報(bào)告(并附上重要的引用),描述發(fā)現(xiàn)的內(nèi)容。
它給出的計(jì)劃是:
Pillar Point Harbor是北美西海岸最大的棕色鵜鶘棲息地之一。找到北美西海岸其他大的棕色鵜鶘棲息地。
1. 查找北美西海岸棕色鵜鶘棲息地的列表。
2. 查找關(guān)于棕色鵜鶘棲息地及其大小的研究論文或文章。
3. 查找來自鳥類觀察組織或政府機(jī)構(gòu)關(guān)于棕色鵜鶘棲息地的信息。
4. 將(3)中找到的棲息地大小與Pillar Point Harbor棲息地的大小進(jìn)行比較。
5. 查找與棕色鵜鶘棲息地和其種群相關(guān)的新聞文章或最新報(bào)告。
它挖掘了大量的細(xì)節(jié),包括2016-2019年太平洋棕色鵜鶘調(diào)查報(bào)告中的PDF文件,而Simon最關(guān)心的就是這些——其中包含的列表讓他很滿意:
十大超級(jí)棲息地(通常棲息超過500只鵜鶘的地方):
- 阿拉米達(dá)防波堤(Alameda Breakwater),加利福尼亞州(3,183)
- 支柱點(diǎn)港(Pillar Point Harbor),加利福尼亞州(1,481)
- 東沙島(East Sand Island),俄勒岡州(1,121)
- 阿諾新月州立公園(Ano Nuevo State Park),加利福尼亞州(1,068)
- 薩利納斯河口(Salinas River mouth),加利福尼亞州(762)
- 博利納斯瀉湖(Bolinas Lagoon),加利福尼亞州(755)
- 莫羅巖(Morro Rock),加利福尼亞州(725)
- 莫斯蘭丁(Moss landing),加利福尼亞州(570)
- 克雷森特城港(Crescent City Harbor),加利福尼亞州(514)
- Tomales鳥巖(Bird Rock Tomales),加利福尼亞州(514)
Simon才知道,他所在的支柱點(diǎn)港(Pillar Point Harbor)是第二大棲息地!
對(duì)Simon來說,利用當(dāng)前的LLM,完全可以自己構(gòu)建科研助手。
它們能夠驅(qū)動(dòng)工具,能提出相對(duì)淺顯的研究計(jì)劃(尋找新聞文章和研究論文)。而且如果搜索并收集到適當(dāng)?shù)纳舷挛模鼈兙湍芎铣珊侠淼拇鸢浮?/span>
Google尤其擅長(zhǎng)此道:他們擁有全球最大的網(wǎng)站搜索索引,而且Gemini模型的上下文可以包含200萬token。
Simon預(yù)計(jì)Deep Research會(huì)越來越好,并且吸引來大量競(jìng)爭(zhēng)者。
三年后:AI輔助拿下普利策獎(jiǎng)
Simon做了一個(gè)有點(diǎn)自利(self-serving)的預(yù)測(cè):認(rèn)為三年之內(nèi),有人將因由生成式AI工具輔助的調(diào)查報(bào)道而獲得普利策獎(jiǎng)。
但并不是說LLM會(huì)寫這篇文章!
他依然認(rèn)為,讓LLM代替人寫文章,是最無趣的應(yīng)用之一。
之所以稱這個(gè)預(yù)測(cè)是自利的,是因?yàn)镾imon希望他能推動(dòng)這一事件的發(fā)生!
他開源了數(shù)據(jù)新聞工具套件Datasette,還在不斷增加AI功能。
比如,利用LLM來數(shù)據(jù)增強(qiáng);從非結(jié)構(gòu)化文本中,提取結(jié)構(gòu)化數(shù)據(jù)并轉(zhuǎn)化為表格。
他的夢(mèng)想是這些工具——或者類似的工具——能夠被用于獲獎(jiǎng)的調(diào)查報(bào)道。
他之所以選擇三年這個(gè)時(shí)間,就是因?yàn)樽屓藗兤毡榱私馊绾呜?fù)責(zé)任地、有效地使用這些工具,并將應(yīng)用于實(shí)際工作,需要這么長(zhǎng)時(shí)間。
LLM并不是新聞業(yè)的天然的契合點(diǎn):記者尋求真相,而LLM通常容易產(chǎn)生幻覺,捏造事實(shí)。
但是,記者也非常擅長(zhǎng)從不可信的來源中提取有用信息——這也是新聞工作的重要部分。
一下兩個(gè)領(lǐng)域,他認(rèn)為L(zhǎng)LM特別適合新聞業(yè):
- 結(jié)構(gòu)化數(shù)據(jù)提取。如果利用《信息自由法》,成功獲得了1萬份PDF文件,那么需要有人或某些工具來閱讀這些文件,并找到暗藏的故事。而LLM非常擅長(zhǎng)處理大量信息,并整理出有意義的內(nèi)容。它們可以生成線索,幫助找出值得深入調(diào)查的故事。
- 編程輔助。編寫代碼、分析數(shù)據(jù)是現(xiàn)代數(shù)據(jù)新聞的重要部分——從SQL查詢到數(shù)據(jù)清理腳本、定制網(wǎng)絡(luò)抓取工具或可視化工具,都可以幫助從雜亂的信息中找到有價(jià)值的信號(hào)。但大多數(shù)報(bào)社并沒有程序員團(tuán)隊(duì):Simon認(rèn)為在三年內(nèi),將圍繞這種模式構(gòu)建足夠強(qiáng)大的工具,能讓非程序員記者在報(bào)道過程輕松使用這些工具。
Simon希望他自己能夠開發(fā)這類工具!
所以他對(duì)未來三年的具體預(yù)測(cè)是:有人將憑借少量的LLM輔助贏得普利策獎(jiǎng)。
更普遍的預(yù)測(cè)是:三年后,大多數(shù)專業(yè)消息人士將LLM作為日常工作流的一部分,而且使用方式也越來越復(fù)雜,但大家卻習(xí)以為常、熟視無睹。
三年后:隱私法將落地
另一個(gè)三年后的預(yù)測(cè)涉及隱私立法。
定向廣告和人們粘貼到模型的數(shù)據(jù)到底會(huì)發(fā)生什么,已經(jīng)引起了人們的杯弓蛇影(往往是有理由的),而且還在不斷增長(zhǎng)。
Simon曾寫過,蘋果通過監(jiān)聽手機(jī)麥克風(fēng)來定向廣告,是「無法根除的陰謀論」。
過去, 他也曾寫過關(guān)于AI信任危機(jī)的文章:許多人拒絕相信模型并不會(huì)基于他們的輸入數(shù)據(jù)進(jìn)行訓(xùn)練,而且背后的公司已經(jīng)反復(fù)否認(rèn)。
他認(rèn)為,AI行業(yè)本身將從立法中受益匪淺,特別是在明確用戶提交數(shù)據(jù)訓(xùn)練方面,而更一般的科技行業(yè),也亟需在數(shù)據(jù)保留和定向廣告等方面制定更嚴(yán)格的規(guī)則。
在未來四年,Simon不指望美國(guó)聯(lián)邦政府能通過相關(guān)立法,但預(yù)計(jì),在州級(jí)或國(guó)際層面,會(huì)看到更多具有實(shí)際執(zhí)行力的隱私法規(guī)。
Simon希望不要因此產(chǎn)生新一代的cookie同意條款。
六年后的烏托邦:令人稱奇的藝術(shù)
對(duì)于六年后的預(yù)測(cè),Simon選擇了兩個(gè)對(duì)立的預(yù)測(cè),一個(gè)樂觀的,一個(gè)悲觀的。
他認(rèn)為六年足夠長(zhǎng),人類會(huì)找到利用AI技術(shù)的方法,創(chuàng)作出真正偉大的藝術(shù)作品。
Simon不認(rèn)為GenAI用于藝術(shù)創(chuàng)作——如圖像、視頻和音樂——能像基于文本的LLM那樣,得到同等的尊重。
生成式藝術(shù)工具很有趣,但它們對(duì)輸出缺乏精細(xì)的控制。
這大大限制了它們的實(shí)用性,現(xiàn)在這些工具只能生成一些供個(gè)人消遣的內(nèi)容。
更重要的是,它們缺乏社會(huì)認(rèn)同。整體社會(huì)氛圍上,大家對(duì)AI生成的藝術(shù)觀感不好。許多有才華的藝術(shù)家,強(qiáng)烈反對(duì)這些工具,甚至在社會(huì)中,「AI」這一術(shù)語也開始變成某種意義上的貶義詞。
圖像和視頻模型也是AI訓(xùn)練數(shù)據(jù)倫理爭(zhēng)論的核心,原因很簡(jiǎn)單:未經(jīng)允許,沒有藝術(shù)家愿意看到他們的作品,被用來訓(xùn)練模型,然后這些模型反過來直接與他們競(jìng)爭(zhēng)!
Simon認(rèn)為六年的時(shí)間足夠讓這一切塵埃落定——讓社會(huì)找到真正提升人類表達(dá)方式的可行方法。
讓他興奮的是,真正有才華、有遠(yuǎn)見、有創(chuàng)意的藝術(shù)家,將利用這六年內(nèi)演變出的工具,創(chuàng)作出有意義的藝術(shù)作品。而且這些工具不可或缺,否則這些藝術(shù)就不可能實(shí)現(xiàn)。
在播客中,Simon談到了《瞬息全宇宙》(Everything Everywhere All at Once),這部電影贏得了2023年七項(xiàng)奧斯卡獎(jiǎng)項(xiàng)。
電影的視覺特效團(tuán)隊(duì),核心只有五個(gè)人。
試想如果能使用六年后才出現(xiàn)的GenAI工具,他們能做出什么樣的作品!
自從播客錄制以后,Simon從Swyx那里了解到,Runway ML已包含在《瞬息全宇宙》的工具集中:
Evan Halleck曾在這支團(tuán)隊(duì),他利用Runway的AI工具節(jié)省時(shí)間,自動(dòng)化了編輯的繁瑣環(huán)節(jié)。特別是在電影的巖石場(chǎng)景中,他使用Runway的轉(zhuǎn)描機(jī)技術(shù)(rotoscoping)快速、干凈地剪輯巖石,同時(shí)沙子和灰塵在鏡頭周圍移動(dòng)。這把原本需要幾天的工作縮短到了幾分鐘。
Simon在播客中預(yù)測(cè),使用GenAI工具的電影,將在六年內(nèi)獲得奧斯卡獎(jiǎng)。
這樣看來他已經(jīng)遲了八年!
六年后的反烏托邦:大規(guī)模社會(huì)動(dòng)蕩
2031年的悲觀預(yù)測(cè)則是關(guān)于「AGI」的,AGI這個(gè)術(shù)語一直在不斷被重新定義。
此前就有報(bào)道,微軟和OpenAI現(xiàn)在將AGI定義為能夠創(chuàng)造1000億美元利潤(rùn)的系統(tǒng)!
如果假設(shè)AGI能夠執(zhí)行目前人類承擔(dān)的幾乎全部的崗位,那么很難不看到潛在的負(fù)面后果。
奧特曼可能嘗試過全民基本收入。但美國(guó)現(xiàn)在連全民醫(yī)保問題都無法解決,更何況全民基本收入!
當(dāng)大多數(shù)工作被機(jī)器取代時(shí),很難想象未來的經(jīng)濟(jì)怎么能為大多數(shù)人服務(wù)。
所以,他為2031年做的悲觀預(yù)測(cè)是:如果這種形式的AGI到來,那么它將帶來極其糟糕的經(jīng)濟(jì)后果和大規(guī)模的社會(huì)動(dòng)蕩。
他心目中的AI烏托邦是能夠增強(qiáng)當(dāng)前人類能力的AI工具。
這正是迄今為止利用LLM所做的事。
他理想中的狀態(tài)是這些工具不斷改進(jìn),最終使人類能夠完成更加宏偉的工作。
如果有一種AGI能實(shí)現(xiàn)這種烏托邦,他愿意全力以赴。
作者介紹
Simon Willison是一位英國(guó)程序員,Lanyrd社交會(huì)議目錄的聯(lián)合創(chuàng)始人,以及Web框架Django的聯(lián)合創(chuàng)造者。
2010年末,他作為聯(lián)創(chuàng)推出了社交會(huì)議目錄Lanyrd,后被收購。
2019年-2020年,他在斯坦福大學(xué)擔(dān)任約翰·S·奈特研究員(JSK fellow),開始構(gòu)建服務(wù)于數(shù)據(jù)新聞學(xué)的、開源的工具生態(tài)系統(tǒng)。
從2002年,他開始堅(jiān)持在個(gè)人博客上發(fā)表文章。