4 個(gè)關(guān)鍵的 AI 趨勢(shì) | 吳恩達(dá)在 Snowflake Build 2024 上的演講大綱
AI 就像電力一樣。”這是因?yàn)椋鳛橐环N通用技術(shù)(類(lèi)似于電力),AI 有著無(wú)數(shù)的應(yīng)用場(chǎng)景。如果有人問(wèn)你:“電力能用來(lái)做什么?” 這個(gè)問(wèn)題很難回答,因?yàn)殡娏缀鯚o(wú)處不在。同樣,新興的AI技術(shù)正在為我們創(chuàng)造一個(gè)龐大的機(jī)會(huì)空間,能夠開(kāi)發(fā)以前無(wú)法實(shí)現(xiàn)的應(yīng)用。
經(jīng)常有人問(wèn)我:“AI最大的機(jī)會(huì)在哪里?” 我對(duì)AI技術(shù)棧的理解是這樣的:在最底層,是半導(dǎo)體技術(shù)。在其上是云基礎(chǔ)設(shè)施。當(dāng)然,再往上是各種基礎(chǔ)模型訓(xùn)練工具和模型本身。大眾和媒體的注意力通常集中在技術(shù)棧的這些層級(jí),尤其是生成式AI等新技術(shù)層面。這本身沒(méi)有問(wèn)題,但我認(rèn)為還有一個(gè)層級(jí)值得更多關(guān)注,那就是應(yīng)用層。
應(yīng)用層是我們創(chuàng)造價(jià)值和收入的地方,它最終支持整個(gè)技術(shù)棧的發(fā)展。因此,我花了很多時(shí)間思考AI的應(yīng)用,因?yàn)槲蚁嘈拍抢锸菢?gòu)建新事物的最佳機(jī)會(huì)所在。
過(guò)去幾年中,尤其是在生成式AI的推動(dòng)下,機(jī)器學(xué)習(xí)模型開(kāi)發(fā)的速度顯著加快。例如,構(gòu)建一個(gè)情感分類(lèi)器(用于分析文本情感正面或負(fù)面的工具)以進(jìn)行聲譽(yù)監(jiān)控。使用傳統(tǒng)的監(jiān)督學(xué)習(xí)方法,通常需要一個(gè)月時(shí)間收集標(biāo)注數(shù)據(jù),再用幾個(gè)月訓(xùn)練模型,之后還需額外時(shí)間部署平臺(tái)。總體來(lái)看,即使是最頂尖的團(tuán)隊(duì),構(gòu)建有價(jià)值的AI系統(tǒng)通常需要6到12個(gè)月。
生成式AI讓某些類(lèi)別的應(yīng)用開(kāi)發(fā)可以在數(shù)日內(nèi)完成。例如,編寫(xiě)一個(gè)提示(prompt)只需幾天時(shí)間,快速部署后,能夠?qū)⒁郧靶枰獢?shù)月完成的應(yīng)用縮短到10天以?xún)?nèi)。這為快速實(shí)驗(yàn)、原型設(shè)計(jì)和快速推出AI產(chǎn)品打開(kāi)了激動(dòng)人心的可能性。
快速實(shí)驗(yàn)已成為創(chuàng)新的更佳路徑。過(guò)去,當(dāng)開(kāi)發(fā)一項(xiàng)產(chǎn)品需要6個(gè)月時(shí),團(tuán)隊(duì)必須進(jìn)行廣泛的市場(chǎng)研究、驗(yàn)證用戶(hù)需求并仔細(xì)規(guī)劃。但現(xiàn)在,快速行動(dòng)的AI團(tuán)隊(duì)可以在一個(gè)周末開(kāi)發(fā)20個(gè)原型,然后評(píng)估哪些有效。如果有18個(gè)失敗也沒(méi)關(guān)系,只需堅(jiān)持那2個(gè)成功的即可。這種快速迭代的方式正在解鎖新的用戶(hù)體驗(yàn)創(chuàng)造機(jī)會(huì)。
然而,這一趨勢(shì)也帶來(lái)了新的挑戰(zhàn)。例如,評(píng)估(或稱(chēng)“evals”)成為了一個(gè)瓶頸。在監(jiān)督學(xué)習(xí)中,收集10,000個(gè)訓(xùn)練數(shù)據(jù)的同時(shí),也可以順便收集1,000個(gè)測(cè)試數(shù)據(jù),幾乎沒(méi)有額外成本。但對(duì)于基于大語(yǔ)言模型的應(yīng)用,往往沒(méi)有現(xiàn)成的訓(xùn)練數(shù)據(jù)。如果測(cè)試需要?jiǎng)?chuàng)建1,000個(gè)示例,便成為一個(gè)顯著的瓶頸。因此,開(kāi)發(fā)流程從過(guò)去的順序構(gòu)建與數(shù)據(jù)收集,轉(zhuǎn)變?yōu)椴⑿羞M(jìn)行。
雖然機(jī)器學(xué)習(xí)原型開(kāi)發(fā)的速度比以往任何時(shí)候都快,但軟件開(kāi)發(fā)生命周期的其他部分(包括設(shè)計(jì)、軟件集成、部署和運(yùn)營(yíng))并沒(méi)有以相同的速度加速。這使得組織面臨壓力,要求加快這些流程以匹配機(jī)器學(xué)習(xí)開(kāi)發(fā)的速度。
“快速行動(dòng)、打破常規(guī)”這一口號(hào)因?yàn)閹?lái)了負(fù)面后果而名聲不佳。但這并不意味著我們不應(yīng)該快速行動(dòng)。更好的方式是“快速行動(dòng),同時(shí)負(fù)責(zé)”。許多團(tuán)隊(duì)現(xiàn)在能夠快速開(kāi)發(fā)原型、穩(wěn)健評(píng)估并負(fù)責(zé)任地迭代,以更快的速度構(gòu)建系統(tǒng),同時(shí)不犧牲安全性或質(zhì)量。
在技術(shù)趨勢(shì)方面,我最興奮的是智能體AI工作流。如果你問(wèn)我當(dāng)前最重要的AI技術(shù)是什么,我會(huì)說(shuō)是智能體AI。當(dāng)我今年初提出這一點(diǎn)時(shí),這一想法還有些爭(zhēng)議,但現(xiàn)在“AI智能體”一詞已經(jīng)被廣泛接受。
從技術(shù)角度看,智能體工作流的核心在于迭代式流程:AI先生成一個(gè)草稿,再進(jìn)行網(wǎng)絡(luò)研究,撰寫(xiě)初稿,批判修改,然后重復(fù)這一過(guò)程。與一次性輸出相比,這種方法雖然更耗時(shí),但效果顯著提升。
例如,在我合作的一些團(tuán)隊(duì)中,智能體工作流被應(yīng)用于處理法律文件、輔助醫(yī)療診斷或管理合規(guī)性文檔。相比傳統(tǒng)方法,這種迭代流程能夠顯著提高結(jié)果的質(zhì)量。
在某些基準(zhǔn)測(cè)試中,智能體工作流的優(yōu)越性得到了驗(yàn)證。例如,在OpenAI的人類(lèi)評(píng)估基準(zhǔn)中解決編程難題時(shí),GPT-3.5的準(zhǔn)確率為48%,GPT-4提高到67%,而GPT-3.5結(jié)合智能體工作流后躍升至95%。這是一個(gè)顯著的提升。
智能體工作流有四種主要設(shè)計(jì)模式:
- 反思(Reflection):模型迭代地批判和改進(jìn)自己的輸出。例如,生成代碼、審視代碼、然后根據(jù)反饋改進(jìn),這一過(guò)程通常可以提升性能。
- 工具使用(Tool Use):大語(yǔ)言模型生成并執(zhí)行API調(diào)用、進(jìn)行網(wǎng)絡(luò)搜索或其他自動(dòng)化操作,從而擴(kuò)展了它們可以執(zhí)行的任務(wù)范圍。
- 規(guī)劃(Planning):AI將復(fù)雜任務(wù)分解為一系列子任務(wù)并按順序執(zhí)行。這種方法對(duì)復(fù)雜工作流尤為有用。
- 多智能體協(xié)作(Multi-Agent Collaboration):模型扮演多個(gè)角色(如編碼員、批評(píng)者)或模擬多個(gè)“智能體”之間的協(xié)作,以實(shí)現(xiàn)更優(yōu)的結(jié)果。
智能體工作流在多模態(tài)AI領(lǐng)域的應(yīng)用尤其令人興奮,在這里,模型不僅能處理文本,還能分析圖像、視頻等多種數(shù)據(jù)類(lèi)型。例如,模型可以逐步分析圖像,檢測(cè)人臉、識(shí)別物體,并迭代地生成詳細(xì)輸出。
總結(jié)來(lái)說(shuō),AI技術(shù)棧正在演進(jìn),出現(xiàn)了一個(gè)新的智能體編排層,使得開(kāi)發(fā)者能夠更輕松地構(gòu)建強(qiáng)大的應(yīng)用。特別是視覺(jué)AI的崛起,為企業(yè)從以前未開(kāi)發(fā)的圖像和視頻數(shù)據(jù)中提取價(jià)值提供了新的機(jī)會(huì)。
最后,我認(rèn)為以下四個(gè)AI趨勢(shì)最值得關(guān)注:
- 由半導(dǎo)體和軟件進(jìn)步推動(dòng)的更快的token生成。
- 大語(yǔ)言模型不僅優(yōu)化了回答問(wèn)題,還優(yōu)化了工具使用和迭代工作流。
- 數(shù)據(jù)工程在管理無(wú)結(jié)構(gòu)數(shù)據(jù)(如文本、圖像、視頻)中的重要性日益增長(zhǎng)。
- 視覺(jué)AI革命的到來(lái),將為從視覺(jué)數(shù)據(jù)中提取價(jià)值打開(kāi)巨大的潛力。
這是一個(gè)激動(dòng)人心的時(shí)代,生成式AI促進(jìn)了更快的實(shí)驗(yàn),而智能體AI則擴(kuò)展了我們的可能性。許多以前不可能的應(yīng)用,無(wú)論是視覺(jué)AI還是其他領(lǐng)域,現(xiàn)在都可以實(shí)現(xiàn)。
本文轉(zhuǎn)載自??AI取經(jīng)路??,作者:AI取經(jīng)路
