嘉賓|百度智能云技術委員會主席 孫珂
撰稿 | 云昭
2023,如果將全球科技比作一首雄渾熱烈的交響曲,那么大模型無疑成為了最為激越人心的主旋律。而與海外大模型的幾大巨頭你追我趕的激烈競爭敘事不同,國內(nèi)的大模型發(fā)展與創(chuàng)新的軌跡方向,似乎看百度就夠了。
領航者與追隨者之間的區(qū)別就是創(chuàng)新。距離3月16日文心一言發(fā)布以來,百度一直在大模型賽道上狂飆向前,遙遙領先。從文心產(chǎn)品的全社會開放、插件矩陣的推出、再到10月媲美甚至部分超越GPT4的文心一言4.0的正式發(fā)布、AI原生應用的提出,每一步都成為了中國大模型創(chuàng)新的風向標。
然而創(chuàng)新永無止境,正在人們苦苦思考如何迎接2024這個AI原生應用爆發(fā)之年時,百度再一次讓業(yè)界見證了虹吸效應的威力:12月20日,在2023百度云智大會·智算大會上,百度放出一記大招,宣布AI原生應用開發(fā)工作臺——百度智能云千帆AppBuilder全面開放服務。
七天后,51CTO有幸受邀來到百度大廈,得以采訪在智算大會上為大家展示分鐘級構建AI原生應用的重磅人物——百度智能云技術委員會主席孫珂。
創(chuàng)新是一個觀察和驗證的過程
AppBuilder的推出,“整體而言,這是一個觀察和驗證的過程。”
在回想這個開發(fā)平臺的研發(fā)過程時,孫珂用了這樣一句簡單的話來概括。繼續(xù)追問之下,背后的故事浮出水面。
“因為在百度內(nèi)部,一直都在圍繞大模型做各種各樣的應用嘗試。在這個過程中,我們逐漸發(fā)現(xiàn)它的應用架構和一些功能是趨同的。而且隨著基于EB4的能力逐漸體現(xiàn),我們進而發(fā)現(xiàn)這種能力可以實施為分層的架構。”
此前據(jù)悉,通過文心大模型,某位客戶甚至在三分鐘內(nèi)就開發(fā)完成了官網(wǎng)客服。“在提前一兩個月的時間,我們觀察到這一趨勢,并在8月份左右確定這是一個值得推進的方向。隨后,我們開始搭建平臺和產(chǎn)品,并在10月世界大會上展示了原型。然后,進一步梳理了產(chǎn)品結構和概念,并于12月20號正式開放。”
一款極大降低AI原生應用門檻的開發(fā)工具,就是這樣在觀察和驗證的過程中誕生的。
百度眼中的AI原生應用樣貌
正如同云計算像云原生演進一樣,當“應用+AI”邁向AI原生應用時,到底哪里發(fā)生了變化呢?
孫珂認為,現(xiàn)在提“AI原生應用”,更多代表了一個基于AI驅動應用的全新時代,就如同大家提“移動應用”一樣,并沒有固定的形態(tài)。
然而,我們可以從AI驅動的業(yè)務形態(tài)去逐漸讓“AI原生應用”的樣貌清晰起來。
首先我們看到的是基于AI去做創(chuàng)作能力,再有就是去做問答型、知識獲取和推薦的能力。這是兩個常見的業(yè)務形態(tài)。再往下延伸,用戶就會基于AI去完成更復雜的任務,比如GBI,這方面就可能會由Agent來完成。
此外,AI原生還有一個比較擅長的事情,即可以加速現(xiàn)有的應用操作,就像Robin經(jīng)常會講的,我們的GUI(圖形用戶界面)菜單應該縮減到二級以內(nèi)。
例如我們在制作PPT時的繪圖操作、文本樣式編輯工作等場景時,往往需要到三級菜單里才能找到一個功能。那么AI原生應用來之后,這些常見的功能的GUI界面上的所展示的Button的層級,可能最多只有兩級,而無需再切換到任何的table頁,極大提高操作效率。
現(xiàn)在的AI與應用怎樣結合才能更“原生”呢?孫珂提出了一個很形象的“P圖”的例子。他認為,在Photoshop中,現(xiàn)在一些復雜的操作流程和固定的任務,比如人像摳圖等,繁瑣且耗時,都可能會演進成通過對話框來完成。
“將這些功能隱藏在AI原生的能力背后,通過簡單的自然語言描述,就可以快速自動地去完成這些操作。”
而對于簡單的任務,比如摳完圖像的位置挪移,用戶還是會希望用鼠標來挪動,而不是用語言指令去讓AI實現(xiàn)。
復雜功能交給AI,讓用戶更加專注于創(chuàng)作和創(chuàng)意。“這是一個理想的AI原生的結合方式。不管是基于Agent驅動,還是說做操作增強,未來的產(chǎn)品如果沒有這些AI原生的功能,可能會喪失很多競爭力。”
因此,我們可以預見到一個非常廣闊的全新場景,AI原生的結合方式可以深入到各行各業(yè)中,它將成為未來產(chǎn)品的重要組成部分。
解構AppBuilder,預見下一代大模型應用
AI原生應用的前景已經(jīng)鋪開,又該如何打造一款適配AI原生能力的應用開發(fā)框架呢?
我們注意到百度千帆推出的Appbuilder給出了最早的三個框架:RAG、GBI、Agent。孫珂提到,之所以選擇這三個,是基于“市場需求驅動產(chǎn)品”的核心邏輯去做出的判斷。
首先,為什么第一時間做RAG框架?這里有兩點原因。第一,“目前在做大模型應用的玩家,不一定只做RAG,但是一定會做RAG。”孫珂告訴51CTO,目前Appbuilder的用戶有八成以上的都在做RAG,因此,一定要優(yōu)先幫助用戶解決最關注、最普遍的需求。第二,RAG又恰好是一個業(yè)內(nèi)公認、相對較穩(wěn)定的大模型應用框架,可以用來解決大模型在發(fā)布以后一系列的痛點問題,比如幻覺問題、穩(wěn)定性問題。這些東西業(yè)內(nèi)本來就是很公認的,相對比較穩(wěn)定的大模型的應用框架。
其次,對于GBI,市場需求也出人意料的廣泛,自10月17日百度世界大會上發(fā)布之后,申請百度GBI的線索蜂擁而至。孫珂指出,目前GBI有著不同層次的需求,有開發(fā)者、集成商,甚至一些終端用戶也會對這一場景有強訴求。與此同時,孫珂認為,GBI是“RAG再往下走、大模型深度應用”的一個重要里程碑。相較于RAG“用自然語言生成自然語言”,GBI則能夠用自然語言生成SQL語句,幫助用戶進行程序性操作。大模型非常需要這樣的框架。一方面,很多人希望把它作為數(shù)據(jù)庫可直接詢問表格的完整應用;另一方面,它會整合到各種各樣的AI原生應用里面去做一些零部件,甚至RAG內(nèi)都會集成GBI,比如,在搜索的文檔中含有表格,就會需要使用GBI來進行詢問。
最后,對于Agent,孫珂表示,它是下一代大模型應用的一個雛形。雖然現(xiàn)在市面上的agent可能還沒有很完善,但它是大模型未來發(fā)揮應用價值的重要方向。Agent能夠將大模型對世界的感知、對語言的感知轉化成一系列行為操控的動作,去分解、執(zhí)行和操控,最終成為一個真正的助理。現(xiàn)在市面上Agent有大量的開發(fā)需求和應用需求,開發(fā)框架也不少,“選擇Agent,目的是讓大家先能用起來,然后隨時反饋,我們也會根據(jù)反饋去快速優(yōu)化它,最終期望呈現(xiàn)給大家一個強大、普適的Agent能力。”
總之,AppBuilder選擇這幾個框架均是基于市場需求和未來發(fā)展前景的考慮。“未來如果有更多的框架值得探索,百度團隊也會繼續(xù)探索,最終目標是加速大模型應用的開發(fā)。”
越過“科技落地線”,百度會打造超級AI應用嗎
一個時代到來的背后,總有著一條科技落地線,只有越過這條線,才能解鎖超級應用。就像喬布斯拿出了觸摸屏的iPhone那樣,讓用戶跨入了擁有了更靈活、更流暢操作的移動智能時代。
同樣,放眼國內(nèi)大模型,百度ERNIE-Bot 4.0有理由最有可能先達到并且越過這條落地線。孫珂表示,百度在AI原生應用方面具有領先優(yōu)勢,包括從底層架構到模型效果的全方位能力。而且基于這些先發(fā)優(yōu)勢,百度會持續(xù)保持領先地位。
具體來講,百度在芯片、框架、模型、應用這四層布局中,芯片和框架這兩層本質(zhì)上對應的是性能,決定著模型的用戶規(guī)模上限,因為性能一旦做好,成本就可以做到足夠便宜。
孫珂表示,很多大模型調(diào)用并不便宜。“剛才提到的的Agent和GBI,背后都必須要基于EB4(ERNIE-Bot 4.0),而且每一條后面都要調(diào)六七次EB4,累加起來調(diào)用費用較高。要降低每一次的調(diào)用成本,最終保證所有人都能用得起這些復雜的AI原生應用,百度有著底層的天然優(yōu)勢。”
模型和應用這兩層,體現(xiàn)在模型的整體效果上,考驗的是大模型真正高級的能力,國內(nèi)橫向去看,無論是GBI、還是Agent,百度的ERNIE-Bot 4.0能力還是最強的。
底層實力的優(yōu)勢也造就了前瞻的實踐優(yōu)勢。比如,百度在AI云方面,如何將AI能力封裝成合適的形態(tài)快速提供給開發(fā)者,都有著獨特的認知和經(jīng)驗。
那么,AI超級應用會出自百度嗎?
這個問題有些左右互搏。但其實從百度整體立場上來看,更多是希望別的公司做出來爆款的AI原生應用的。“不一定是百度自己做出來的,也會有別人做出來,我們更多提供的是基礎設施。”
正如Robin在百度內(nèi)部講話中所提到的,因為百度比別人先走一步,希望把百度的能力和Know How標準化和產(chǎn)品化以后開放給社會,提供給更多的人,做出優(yōu)秀的AI原生應用。
此外,在孫珂看來,AI原生的超級應用并不只會有一款、兩款,在未來會有多個爆款應用。
“身處一個繁榮的AI時代,任何一款應用都肯定掩蓋不了其他應用的光芒。”
一枝獨放不是春。孫珂真正期待的是,基于AppBuilder等工具和平臺,大家一起把AI原生應用的時代真正推向爆發(fā)與繁榮。“對于百度智能云、AppBuilder而言,我們最優(yōu)先關注的還是如何幫開發(fā)者提效,我非常樂見開發(fā)者去把AI原生應用做出來。”
AI應用開發(fā)者,需要更多的自由度
提及AppBuilder的設計理念,孫珂表示, AI應用開發(fā)者需要更多的選擇和自由度,因此將框架和組件都做成了可擴展和可拼接的形式。
“如果只給你一套穩(wěn)定的框架和一種切片策略,明顯是不夠的,還有許多工作要做。就像我之前在發(fā)布會上演示的簡歷助手,在做RAG之前,開發(fā)者還需要對簡歷做一些其他處理,讓大模型去進行別的操作,然后再去做檢索。”
正是基于這些訴求,一成不變的框架肯定是沒法解的,因此需要讓這個框架變得可以被開發(fā)者根據(jù)自身來隨意拼接。故而,百度團隊將框架進行了一系列的開源。
除此之外,框架里的每一個零部件,也就是組件,包括各種模態(tài)的組件全部都被整理出來,令開發(fā)者做到任意插拔,無論前序、后序都可以去擴展和定制能力。
此外,據(jù)悉AppBuilder有兩種形態(tài):代碼態(tài)和低代碼態(tài),其中低代碼態(tài)工具會優(yōu)先提供最常見的業(yè)務邏輯,但不會完全放棄代碼態(tài)的開發(fā)方式。孫珂對此表示,“低代碼態(tài)并不會完全取代代碼態(tài),因為開發(fā)者對于業(yè)務邏輯的調(diào)整需求仍然存在。”
AppBuilder真正的理念,并不是說簡簡單單的幫開發(fā)者做出來一個AI應用,而是期望讓開發(fā)者能夠在平臺上找到開發(fā)一個完整的AI原生應用所有的工具和套件。
此外,AppBuilder還針對不同類型的開發(fā)者提供了不同的服務策略。
首先,有能力自己開發(fā)的開發(fā)者,包括頭部互聯(lián)網(wǎng)企業(yè)和一些AI原生應用開發(fā)能力強的企業(yè)。這類企業(yè)對云端的依賴程度不高,使用私有云,不太可能會使用公共云服務。
其次,針對沒有能力獨自開發(fā)的開發(fā)者,主要包括傳統(tǒng)企業(yè)和資源型企業(yè),他們需要外部服務商來提供服務。這類企業(yè)可能對云端訴求不那么強烈,自身開發(fā)能力相對較弱,因此也不是直接客戶,而是間接客戶。
然后,孫珂表示,AI原生應用開發(fā)工具核心目標客戶群包括ISV(獨立軟件開發(fā)商)和to B創(chuàng)企,這些客戶主要服務于一產(chǎn)、二產(chǎn)私有化大客戶和數(shù)量龐大的二級客戶,如餐館、超市等。
此外,平臺還將中腰部互聯(lián)網(wǎng)企業(yè)作為服務對象。這些企業(yè)可能有自己的壁壘和資源,但同樣有企業(yè)智能化和信息化建設的訴求。還有一些致力于做to C業(yè)務的AI創(chuàng)企也是目標客戶之列,這些客戶可能需要對某一些技術有自建的需求,需要快速搭建應用。
孫珂認為,這些客戶群體的行為畫像幾乎一致,都是具備一定開發(fā)能力的企業(yè)和個人,他們使用應用框架和API快速搭建自己想要的內(nèi)容,但服務的目的可能不同。
總的來說,針對不同類型的開發(fā)者,平臺提供了不同的服務策略,以滿足他們的不同需求和特點。
小步快跑,加速開發(fā)者AI應用構建
圍繞在低代碼態(tài)和代碼態(tài)兩個方面,孫珂介紹了AppBuilder下一步的產(chǎn)品規(guī)劃。
在低代碼態(tài)方面,AppBuilder主要面向開發(fā)能力相對較弱的開發(fā)者,幫助他們加速應用構建。為了實現(xiàn)這一目標,AppBuilder會不斷增強其能力,提高靈活性,例如通過增強Agent、GBI和RAG的任務配置能力等。此外,AppBuilder還會開發(fā)更多連接器,幫助開發(fā)者將應用發(fā)布到不同的終端場景,如靈境等。
在代碼態(tài)方面,AppBuilder主要是為深度開發(fā)者提供高效、穩(wěn)定的接口和輔助開發(fā)工具。這些工具包括IDE、調(diào)試環(huán)境等,以便開發(fā)者能夠更好地開發(fā)、調(diào)試和優(yōu)化應用。同時,AppBuilder還會發(fā)布更多API和配置選項,提供更好的可玩性和調(diào)用效率。此外,AppBuilder還會開放更多開發(fā)模板(如cook book),指導開發(fā)者如何使用這些API進行應用開發(fā)。
最后,孫珂提到AppBuilder的迭代速度很快,小版本幾乎每周都在上線。大版本的更新則按月進行,包括發(fā)布新功能和優(yōu)化現(xiàn)有功能。雖然無法給出具體的時間表,但可以確定的是,AppBuilder會持續(xù)不斷地推出新功能和優(yōu)化現(xiàn)有功能,以幫助開發(fā)者更高效地進行應用開發(fā)。
未來:做國內(nèi)最大的AI原生應用生態(tài)
“百度要做到國內(nèi)最大的AI原生應用開發(fā)生態(tài),并期望有百萬級的開發(fā)者。”
提及未來AI原生應用開發(fā)的未來,孫珂信心十足。在他看來,AI原生應用市場將會比移動時代更大,并期望能夠在這個時代里面做到佼佼者。
首先,他認為不排除會有極客團隊會自己制作鏟子,但真正有實力的玩家數(shù)量仍然有限。在開源生態(tài)和整個云端所有開發(fā)資源之間的關聯(lián)方面,孫珂認為國內(nèi)相對較弱。
其次,孫珂指出,“做鏟子一個基本的邏輯是,你至少得有一個基礎資源的承載位置,比如你的大模型哪里承載,BOS在哪承載。放眼國內(nèi),我確實覺得可能大廠,特別是云廠商把這件事做起來的機會更大。”
最重要的是,百度做的不只是一把鏟子,而是一套包括大模型等基礎設施在內(nèi)的全副淘金裝備,一套真正能夠持續(xù)推動和繁榮國內(nèi)AI原生應用開發(fā)生態(tài)的創(chuàng)新孵化器。