谷歌打響全面反擊戰(zhàn)!官宣AI重構(gòu)搜索、新模型比肩GPT-4,朝著ChatGPT微軟開(kāi)炮
萬(wàn)眾矚目,谷歌的反擊來(lái)了。
現(xiàn)在,谷歌搜索終于要加入AI對(duì)話功能了,排隊(duì)通道已經(jīng)開(kāi)放。
當(dāng)然這還只是第一步。
大的還在后面:
全新大語(yǔ)言模型PaLM 2正式亮相,谷歌聲稱(chēng)它在部分任務(wù)超越GPT-4。
Bard能力大更新,不用再排隊(duì)等候,并支持新語(yǔ)言。
谷歌版AI辦公助手也一并推出,將在Gmail中搶先亮相。
谷歌云也上線多個(gè)基礎(chǔ)大模型,為行業(yè)提供更進(jìn)一步的生成式AI服務(wù)……
在最新一屆I/O開(kāi)發(fā)者大會(huì)上,谷歌的大放送真的太震撼。
有網(wǎng)友直呼:
AI大戰(zhàn)全面開(kāi)啟。
有人甚至表示:
現(xiàn)在我后悔為ChatGPT付費(fèi)了。
一場(chǎng)發(fā)布會(huì)結(jié)束,谷歌股價(jià)上漲超4%。
PaLM 2部分任務(wù)超越GPT-4
毫無(wú)疑問(wèn),PaLM 2是今年I/O大會(huì)的重中之重,由皮查伊親自做介紹。
目前的Bard以及谷歌超過(guò)25個(gè)AI產(chǎn)品和功能,現(xiàn)在都由PaLM 2作為底層技術(shù)支持。
作為谷歌目前最先進(jìn)的大模型,PaLM 2基于Pathways架構(gòu),是PaLM的升級(jí)版,通過(guò)JAX在TPU v4上構(gòu)建。
據(jù)介紹,PaLM 2接受了100多種語(yǔ)言的訓(xùn)練,這使得它在語(yǔ)言理解、生成和翻譯上的能力更強(qiáng),并且會(huì)更加擅長(zhǎng)常識(shí)推理、數(shù)學(xué)邏輯分析。
谷歌表示,PaLM 2的數(shù)據(jù)集中有海量論文和網(wǎng)頁(yè),其中包含非常多數(shù)學(xué)表達(dá)式。在這些數(shù)據(jù)的訓(xùn)練后,PaLM 2能輕松解決數(shù)學(xué)問(wèn)題,甚至是制作圖表。
編程方面,PaLM 2現(xiàn)在支持20種編程語(yǔ)言,如Python、JavaScript等常用語(yǔ)言,以及Prolog、Fortran和Verilog等。
這一次谷歌一并推出了四種不同size的PaLM 2。
他們用不同的動(dòng)物來(lái)體現(xiàn)規(guī)模大小。最小的是“壁虎”,最大的是“獨(dú)角獸”。
其中“壁虎”版本是非常輕量級(jí)的,能在移動(dòng)設(shè)備上快速運(yùn)行,包括離線狀態(tài);每秒可處理20個(gè)token。
DeepMind副總裁在I/O大會(huì)前的新聞發(fā)布會(huì)上表示:
我們發(fā)現(xiàn)模型并不總是越大越好,這也是為什么我們決定提供一系列不同規(guī)模的模型。
這意味著微調(diào)PaLM 2會(huì)更加方便,由此它也能支持更多產(chǎn)品和應(yīng)用。
在I/O大會(huì)上,谷歌就宣布了現(xiàn)在已經(jīng)有超過(guò)25個(gè)產(chǎn)品和應(yīng)用正在使用PaLM 2的能力。
具體的表現(xiàn)形式,就是Duet AI。
可以將它理解為微軟365 Copilot的對(duì)標(biāo)產(chǎn)品,是一個(gè)能夠內(nèi)嵌在各種辦公軟件中的AI助手。
谷歌在發(fā)布會(huì)現(xiàn)場(chǎng)已經(jīng)展示了Duet AI在Gmail、Google Docs、Google Sheets中的能力。
包括根據(jù)提示補(bǔ)充郵件內(nèi)容、生成PPT、根據(jù)提示生成圖片素材、一鍵生成表格等。
同樣,這個(gè)AI助手也能提供編程幫助。基于谷歌云,它能實(shí)時(shí)推薦、糾錯(cuò)代碼塊,并且以對(duì)話方式解答編程問(wèn)題,目前支持Go、JavaScript、Python和SQL。
另外基于PaLM 2,谷歌還推出了一些專(zhuān)業(yè)領(lǐng)域大模型。
谷歌的健康團(tuán)隊(duì)打造了Med-PaLM 2。它能回答各種醫(yī)學(xué)問(wèn)題,據(jù)稱(chēng)是首個(gè)在美國(guó)醫(yī)療執(zhí)照考試中達(dá)到專(zhuān)家水平的大語(yǔ)言模型。
目前谷歌正在嘗試讓它具備多模態(tài)能力,比如自己檢查X光片后給出診斷。在今年夏天晚些時(shí)候,這個(gè)模型將對(duì)一小部分谷歌云用戶開(kāi)放。
另一個(gè)專(zhuān)業(yè)大模型是Sec-PaLM 2。
這是一個(gè)面向網(wǎng)絡(luò)安全維護(hù)的大模型,它能分析和解釋潛在的惡意腳本,并檢測(cè)腳本的危險(xiǎn)性。
那么,在展示了PaLM 2一眾卓越能力后,就該聊聊怎么開(kāi)放使用了。
谷歌表示,現(xiàn)在可以通過(guò)PaLM API接口、Firebase和Colab使用PaLM 2。
Bard全面開(kāi)放,支持圖片、集成自家地圖等應(yīng)用
對(duì)標(biāo)ChatGPT的Bard終于取消排隊(duì)試用,在全球180+國(guó)家和地區(qū)進(jìn)行全面開(kāi)放了。
新增黑暗模式,備受程序員好評(píng):(手動(dòng)狗頭)
除了擴(kuò)大訪問(wèn)范圍,Bard也在英文之外,新增直接用日語(yǔ)和韓語(yǔ)對(duì)話的功能。中文看起來(lái)還得再等下一波——谷歌表示,很快就會(huì)新增到40種語(yǔ)言版本。
由于從今天起,Bard將全面接入PaLM 2,所以它在編程和推理上面的能力也有了很大的提升,代碼生成、調(diào)試和解釋都更加專(zhuān)業(yè)(獲得程序員認(rèn)可的那種)。
當(dāng)你讓它用python寫(xiě)一段國(guó)際象棋中的“四步殺”(scholar’s mate)招式,里面參考了別的代碼,它會(huì)給出相關(guān)鏈接,方便你查看。
你可以就它給出代碼中某個(gè)不懂的函數(shù)進(jìn)行進(jìn)一步提問(wèn),問(wèn)它能否再改善一下,或者是要求它將所有內(nèi)容都合并的一個(gè)代碼塊中。
不過(guò),最驚喜的當(dāng)屬應(yīng)廣大開(kāi)發(fā)者要求,加入了一鍵導(dǎo)入功能。
現(xiàn)在,你可以將Bard生成的代碼直接導(dǎo)出到Colab。
除了代碼,你用Bard生成的任何內(nèi)容,比如電子郵件草稿、表格什么的也都可以直接拖到Gmail、Docs和Sheets中。
對(duì)了,Bard現(xiàn)在的回答中也支持圖片了。拿來(lái)問(wèn)旅游攻略最方便不過(guò):
除了它能用圖片回答你,你也能直接丟給它圖片,比如上傳一張兩只狗狗的照片,讓它來(lái)幫你編點(diǎn)好玩的故事:
這個(gè)功能由Google Lens(一款能讓機(jī)器學(xué)會(huì)“看圖說(shuō)話”的AI應(yīng)用)提供支持。
除了Google Lens,Docs、Drive、Gmail、地圖等多個(gè)谷歌自家的應(yīng)用能力也整合到了Bard之中。
比如在Bard的回答中直接用谷歌地圖查看幾所大學(xué)的地理位置:
有種現(xiàn)在要用谷歌的各種產(chǎn)品,只用Bard一個(gè)入口就夠了的感覺(jué)。
除了自家應(yīng)用,Bard這次還把Adobe Firefly給搬了上來(lái),各種有版權(quán)的創(chuàng)意圖像用對(duì)話就可以“信手拈來(lái)”:
搜索重構(gòu),加入AI對(duì)話
千呼萬(wàn)呼,谷歌搜索終于開(kāi)啟了AI對(duì)話的能力。
“一家?guī)в幸粋€(gè)不到3歲孩子和一只狗的家庭來(lái)說(shuō),去布萊斯峽谷還是拱門(mén)國(guó)家公園游玩更好?”
對(duì)于這個(gè)問(wèn)題,擱以前,你可能需要自己把它拆成各種小問(wèn)題去搜索引擎整理大量信息,最終才能找到答案。
現(xiàn)在谷歌讓你盡量一步到位。
如圖所示,谷歌搜索沒(méi)有簡(jiǎn)單地搬運(yùn)搜出來(lái)的答案,而是將孩子和狗這兩個(gè)因素都考慮進(jìn)去給出整理后的回答,比如它說(shuō):
布萊斯峽谷有兩條狗能進(jìn)入的環(huán)路,對(duì)嬰兒車(chē)也十分友好;拱門(mén)國(guó)家公園則大部分路段都不允許寵物進(jìn)入;兩個(gè)地方都要求寵物拴上皮帶等。
每句話都有具體的依據(jù)鏈接供查看:
除此之外,它還會(huì)顯示了來(lái)自不同網(wǎng)站網(wǎng)友發(fā)布的攻略鏈接。
最重要的是,你可以對(duì)它的回答進(jìn)行進(jìn)一步對(duì)話式的提問(wèn),點(diǎn)擊“ask for a follow up”按鈕即可。
用新的谷歌搜索進(jìn)行購(gòu)物也非常有趣,它號(hào)稱(chēng)可以幫你迅速做出理性的購(gòu)買(mǎi)決定。
比如當(dāng)你想要一輛“適合5英里山地通勤的自行車(chē)”,它會(huì)先告訴你挑選之前需要考慮的重要因素,比如:
一看設(shè)計(jì):電動(dòng)自行車(chē)、公路自行車(chē)和混合動(dòng)力自行車(chē)等適合通勤;
二看電機(jī)和電池,三看減震用的懸架,有山路的通勤需要應(yīng)對(duì)裂紋和顛簸帶來(lái)的沖擊等。
然后再給你推薦合適的車(chē),推薦時(shí)還會(huì)給出具體產(chǎn)品說(shuō)明、最新評(píng)價(jià)、價(jià)格和圖片等全面信息。
你也可以進(jìn)行進(jìn)一步提問(wèn),比如只要紅色電動(dòng)自行車(chē),它會(huì)進(jìn)一步優(yōu)化回答。
這個(gè)功能由谷歌的購(gòu)物比價(jià)產(chǎn)品Shopping Graph提供支持,它可以搜集并不斷更新來(lái)自全世界的產(chǎn)品列表。
值得一提的是,谷歌直言更新后的AI搜索界面照樣會(huì)植入廣告,但放心:它只會(huì)在專(zhuān)用廣告位中出現(xiàn),不會(huì)混進(jìn)你的搜索結(jié)果中。
最后,這個(gè)新功能目前還只能在谷歌Search Labs中申請(qǐng)?jiān)囉茫覂H限美國(guó)地區(qū)的用戶體驗(yàn)。
三大基礎(chǔ)模型上線谷歌云
今年I/O大會(huì),谷歌云的內(nèi)容也同樣搶眼。
在更新了一大波AI能力后,谷歌為自家云端機(jī)器學(xué)習(xí)平臺(tái)Vertex AI,上新了三款大模型:
Codey:text-to-code,幫助程序員寫(xiě)代碼
Imagen:text-to-image,生成高質(zhì)量圖像
Chirp:speech-to-text,方便溝通
這三種模型的能力其實(shí)在今天的發(fā)布會(huì)上都有展示過(guò),比如生成代碼、谷歌照片智能編輯等。
除此之外,在Vertex AI上現(xiàn)在還能使用文本和圖像的嵌入式API。它支持將文本和圖像數(shù)據(jù)轉(zhuǎn)換為多維數(shù)值向量、映射語(yǔ)義關(guān)系,從而允許開(kāi)發(fā)者創(chuàng)建出更加有意思的應(yīng)用。
另一個(gè)重大更新則在RLHF上,谷歌表示他們是首個(gè)將此功能作為托管服務(wù)放到端到端機(jī)器學(xué)習(xí)平臺(tái)行的。好處是能讓企業(yè)結(jié)合RLHF快速訓(xùn)練獎(jiǎng)勵(lì)模型,用于微調(diào)基礎(chǔ)模型,這對(duì)于大模型在行業(yè)應(yīng)用中的準(zhǔn)確性提升非常關(guān)鍵。
除了模型方面,谷歌云在訓(xùn)練上還推出了下一代A3 GPU超算。通過(guò)將A3虛擬機(jī)和Nvidia H100結(jié)合,谷歌云能夠提供更大的計(jì)算吞吐量和帶寬,能夠讓企業(yè)更快開(kāi)發(fā)機(jī)器學(xué)習(xí)模型。
除了這些,谷歌這次還帶來(lái)售價(jià)1799美元(合人民幣約1萬(wàn)2)的首款折疊屏手機(jī)等新硬件產(chǎn)品,以及接入AI功能的Android 14系統(tǒng)(比如提供信息回復(fù)建議什么的),這里就不一一展示了。
總的來(lái)看,作為第15屆I/O大會(huì),谷歌這次著實(shí)給大家?guī)?lái)了非常多的干貨。
值得一提的是,這次上臺(tái)介紹的發(fā)言嘉賓,已不見(jiàn)Jeff Dean的身影,他前幾日剛剛職級(jí)變動(dòng)。
作為從前Google AI最代表性發(fā)言的高管,在AI 2.0浪潮里,將何在?
谷歌是否還能在大模型和AI搜索領(lǐng)域中奮起追上,也值得期待。
你對(duì)這次谷歌的反擊,滿意嗎?