谷歌打響全面反擊戰(zhàn)！官宣AI重構(gòu)搜索、新模型比肩GPT-4，朝著ChatGPT微軟開(kāi)炮

作者：量子位 2023-05-11 06:59:11

人工智能

PaLM 2接受了100多種語(yǔ)言的訓(xùn)練，這使得它在語(yǔ)言理解、生成和翻譯上的能力更強(qiáng)，并且會(huì)更加擅長(zhǎng)常識(shí)推理、數(shù)學(xué)邏輯分析。

萬(wàn)眾矚目，谷歌的反擊來(lái)了。

現(xiàn)在，谷歌搜索終于要加入AI對(duì)話功能了，排隊(duì)通道已經(jīng)開(kāi)放。

當(dāng)然這還只是第一步。

大的還在后面：

全新大語(yǔ)言模型PaLM 2正式亮相，谷歌聲稱(chēng)它在部分任務(wù)超越GPT-4。

Bard能力大更新，不用再排隊(duì)等候，并支持新語(yǔ)言。

谷歌版AI辦公助手也一并推出，將在Gmail中搶先亮相。

谷歌云也上線多個(gè)基礎(chǔ)大模型，為行業(yè)提供更進(jìn)一步的生成式AI服務(wù)……

在最新一屆I/O開(kāi)發(fā)者大會(huì)上，谷歌的大放送真的太震撼。

有網(wǎng)友直呼：

AI大戰(zhàn)全面開(kāi)啟。

有人甚至表示：

現(xiàn)在我后悔為ChatGPT付費(fèi)了。

一場(chǎng)發(fā)布會(huì)結(jié)束，谷歌股價(jià)上漲超4%。

PaLM 2部分任務(wù)超越GPT-4

毫無(wú)疑問(wèn)，PaLM 2是今年I/O大會(huì)的重中之重，由皮查伊親自做介紹。

目前的Bard以及谷歌超過(guò)25個(gè)AI產(chǎn)品和功能，現(xiàn)在都由PaLM 2作為底層技術(shù)支持。

作為谷歌目前最先進(jìn)的大模型，PaLM 2基于Pathways架構(gòu)，是PaLM的升級(jí)版，通過(guò)JAX在TPU v4上構(gòu)建。

據(jù)介紹，PaLM 2接受了100多種語(yǔ)言的訓(xùn)練，這使得它在語(yǔ)言理解、生成和翻譯上的能力更強(qiáng)，并且會(huì)更加擅長(zhǎng)常識(shí)推理、數(shù)學(xué)邏輯分析。

谷歌表示，PaLM 2的數(shù)據(jù)集中有海量論文和網(wǎng)頁(yè)，其中包含非常多數(shù)學(xué)表達(dá)式。在這些數(shù)據(jù)的訓(xùn)練后，PaLM 2能輕松解決數(shù)學(xué)問(wèn)題，甚至是制作圖表。

編程方面，PaLM 2現(xiàn)在支持20種編程語(yǔ)言，如Python、JavaScript等常用語(yǔ)言，以及Prolog、Fortran和Verilog等。

這一次谷歌一并推出了四種不同size的PaLM 2。

他們用不同的動(dòng)物來(lái)體現(xiàn)規(guī)模大小。最小的是“壁虎”，最大的是“獨(dú)角獸”。

其中“壁虎”版本是非常輕量級(jí)的，能在移動(dòng)設(shè)備上快速運(yùn)行，包括離線狀態(tài)；每秒可處理20個(gè)token。

DeepMind副總裁在I/O大會(huì)前的新聞發(fā)布會(huì)上表示：

我們發(fā)現(xiàn)模型并不總是越大越好，這也是為什么我們決定提供一系列不同規(guī)模的模型。

這意味著微調(diào)PaLM 2會(huì)更加方便，由此它也能支持更多產(chǎn)品和應(yīng)用。

在I/O大會(huì)上，谷歌就宣布了現(xiàn)在已經(jīng)有超過(guò)25個(gè)產(chǎn)品和應(yīng)用正在使用PaLM 2的能力。

具體的表現(xiàn)形式，就是Duet AI。

可以將它理解為微軟365 Copilot的對(duì)標(biāo)產(chǎn)品，是一個(gè)能夠內(nèi)嵌在各種辦公軟件中的AI助手。

谷歌在發(fā)布會(huì)現(xiàn)場(chǎng)已經(jīng)展示了Duet AI在Gmail、Google Docs、Google Sheets中的能力。

包括根據(jù)提示補(bǔ)充郵件內(nèi)容、生成PPT、根據(jù)提示生成圖片素材、一鍵生成表格等。

同樣，這個(gè)AI助手也能提供編程幫助。基于谷歌云，它能實(shí)時(shí)推薦、糾錯(cuò)代碼塊，并且以對(duì)話方式解答編程問(wèn)題，目前支持Go、JavaScript、Python和SQL。

另外基于PaLM 2，谷歌還推出了一些專(zhuān)業(yè)領(lǐng)域大模型。

谷歌的健康團(tuán)隊(duì)打造了Med-PaLM 2。它能回答各種醫(yī)學(xué)問(wèn)題，據(jù)稱(chēng)是首個(gè)在美國(guó)醫(yī)療執(zhí)照考試中達(dá)到專(zhuān)家水平的大語(yǔ)言模型。

目前谷歌正在嘗試讓它具備多模態(tài)能力，比如自己檢查X光片后給出診斷。在今年夏天晚些時(shí)候，這個(gè)模型將對(duì)一小部分谷歌云用戶開(kāi)放。

另一個(gè)專(zhuān)業(yè)大模型是Sec-PaLM 2。

這是一個(gè)面向網(wǎng)絡(luò)安全維護(hù)的大模型，它能分析和解釋潛在的惡意腳本，并檢測(cè)腳本的危險(xiǎn)性。

那么，在展示了PaLM 2一眾卓越能力后，就該聊聊怎么開(kāi)放使用了。

谷歌表示，現(xiàn)在可以通過(guò)PaLM API接口、Firebase和Colab使用PaLM 2。

Bard全面開(kāi)放，支持圖片、集成自家地圖等應(yīng)用

對(duì)標(biāo)ChatGPT的Bard終于取消排隊(duì)試用，在全球180+國(guó)家和地區(qū)進(jìn)行全面開(kāi)放了。

新增黑暗模式，備受程序員好評(píng)：（手動(dòng)狗頭）

除了擴(kuò)大訪問(wèn)范圍，Bard也在英文之外，新增直接用日語(yǔ)和韓語(yǔ)對(duì)話的功能。中文看起來(lái)還得再等下一波——谷歌表示，很快就會(huì)新增到40種語(yǔ)言版本。

由于從今天起，Bard將全面接入PaLM 2，所以它在編程和推理上面的能力也有了很大的提升，代碼生成、調(diào)試和解釋都更加專(zhuān)業(yè)（獲得程序員認(rèn)可的那種）。

當(dāng)你讓它用python寫(xiě)一段國(guó)際象棋中的“四步殺”（scholar’s mate）招式，里面參考了別的代碼，它會(huì)給出相關(guān)鏈接，方便你查看。

你可以就它給出代碼中某個(gè)不懂的函數(shù)進(jìn)行進(jìn)一步提問(wèn)，問(wèn)它能否再改善一下，或者是要求它將所有內(nèi)容都合并的一個(gè)代碼塊中。

不過(guò)，最驚喜的當(dāng)屬應(yīng)廣大開(kāi)發(fā)者要求，加入了一鍵導(dǎo)入功能。

現(xiàn)在，你可以將Bard生成的代碼直接導(dǎo)出到Colab。

除了代碼，你用Bard生成的任何內(nèi)容，比如電子郵件草稿、表格什么的也都可以直接拖到Gmail、Docs和Sheets中。

對(duì)了，Bard現(xiàn)在的回答中也支持圖片了。拿來(lái)問(wèn)旅游攻略最方便不過(guò)：

除了它能用圖片回答你，你也能直接丟給它圖片，比如上傳一張兩只狗狗的照片，讓它來(lái)幫你編點(diǎn)好玩的故事：

這個(gè)功能由Google Lens（一款能讓機(jī)器學(xué)會(huì)“看圖說(shuō)話”的AI應(yīng)用）提供支持。

除了Google Lens，Docs、Drive、Gmail、地圖等多個(gè)谷歌自家的應(yīng)用能力也整合到了Bard之中。

比如在Bard的回答中直接用谷歌地圖查看幾所大學(xué)的地理位置：

有種現(xiàn)在要用谷歌的各種產(chǎn)品，只用Bard一個(gè)入口就夠了的感覺(jué)。

除了自家應(yīng)用，Bard這次還把Adobe Firefly給搬了上來(lái)，各種有版權(quán)的創(chuàng)意圖像用對(duì)話就可以“信手拈來(lái)”：

搜索重構(gòu)，加入AI對(duì)話

千呼萬(wàn)呼，谷歌搜索終于開(kāi)啟了AI對(duì)話的能力。

“一家?guī)в幸粋€(gè)不到3歲孩子和一只狗的家庭來(lái)說(shuō)，去布萊斯峽谷還是拱門(mén)國(guó)家公園游玩更好？”

對(duì)于這個(gè)問(wèn)題，擱以前，你可能需要自己把它拆成各種小問(wèn)題去搜索引擎整理大量信息，最終才能找到答案。

現(xiàn)在谷歌讓你盡量一步到位。

如圖所示，谷歌搜索沒(méi)有簡(jiǎn)單地搬運(yùn)搜出來(lái)的答案，而是將孩子和狗這兩個(gè)因素都考慮進(jìn)去給出整理后的回答，比如它說(shuō)：

布萊斯峽谷有兩條狗能進(jìn)入的環(huán)路，對(duì)嬰兒車(chē)也十分友好；拱門(mén)國(guó)家公園則大部分路段都不允許寵物進(jìn)入；兩個(gè)地方都要求寵物拴上皮帶等。

每句話都有具體的依據(jù)鏈接供查看：

除此之外，它還會(huì)顯示了來(lái)自不同網(wǎng)站網(wǎng)友發(fā)布的攻略鏈接。

最重要的是，你可以對(duì)它的回答進(jìn)行進(jìn)一步對(duì)話式的提問(wèn)，點(diǎn)擊“ask for a follow up”按鈕即可。

用新的谷歌搜索進(jìn)行購(gòu)物也非常有趣，它號(hào)稱(chēng)可以幫你迅速做出理性的購(gòu)買(mǎi)決定。

比如當(dāng)你想要一輛“適合5英里山地通勤的自行車(chē)”，它會(huì)先告訴你挑選之前需要考慮的重要因素，比如：

一看設(shè)計(jì)：電動(dòng)自行車(chē)、公路自行車(chē)和混合動(dòng)力自行車(chē)等適合通勤；

二看電機(jī)和電池，三看減震用的懸架，有山路的通勤需要應(yīng)對(duì)裂紋和顛簸帶來(lái)的沖擊等。

然后再給你推薦合適的車(chē)，推薦時(shí)還會(huì)給出具體產(chǎn)品說(shuō)明、最新評(píng)價(jià)、價(jià)格和圖片等全面信息。

你也可以進(jìn)行進(jìn)一步提問(wèn)，比如只要紅色電動(dòng)自行車(chē)，它會(huì)進(jìn)一步優(yōu)化回答。

這個(gè)功能由谷歌的購(gòu)物比價(jià)產(chǎn)品Shopping Graph提供支持，它可以搜集并不斷更新來(lái)自全世界的產(chǎn)品列表。

值得一提的是，谷歌直言更新后的AI搜索界面照樣會(huì)植入廣告，但放心：它只會(huì)在專(zhuān)用廣告位中出現(xiàn)，不會(huì)混進(jìn)你的搜索結(jié)果中。

最后，這個(gè)新功能目前還只能在谷歌Search Labs中申請(qǐng)?jiān)囉茫覂H限美國(guó)地區(qū)的用戶體驗(yàn)。

三大基礎(chǔ)模型上線谷歌云

今年I/O大會(huì)，谷歌云的內(nèi)容也同樣搶眼。

在更新了一大波AI能力后，谷歌為自家云端機(jī)器學(xué)習(xí)平臺(tái)Vertex AI，上新了三款大模型：

Codey：text-to-code，幫助程序員寫(xiě)代碼

Imagen：text-to-image，生成高質(zhì)量圖像

Chirp：speech-to-text，方便溝通

這三種模型的能力其實(shí)在今天的發(fā)布會(huì)上都有展示過(guò)，比如生成代碼、谷歌照片智能編輯等。

除此之外，在Vertex AI上現(xiàn)在還能使用文本和圖像的嵌入式API。它支持將文本和圖像數(shù)據(jù)轉(zhuǎn)換為多維數(shù)值向量、映射語(yǔ)義關(guān)系，從而允許開(kāi)發(fā)者創(chuàng)建出更加有意思的應(yīng)用。

另一個(gè)重大更新則在RLHF上，谷歌表示他們是首個(gè)將此功能作為托管服務(wù)放到端到端機(jī)器學(xué)習(xí)平臺(tái)行的。好處是能讓企業(yè)結(jié)合RLHF快速訓(xùn)練獎(jiǎng)勵(lì)模型，用于微調(diào)基礎(chǔ)模型，這對(duì)于大模型在行業(yè)應(yīng)用中的準(zhǔn)確性提升非常關(guān)鍵。

除了模型方面，谷歌云在訓(xùn)練上還推出了下一代A3 GPU超算。通過(guò)將A3虛擬機(jī)和Nvidia H100結(jié)合，谷歌云能夠提供更大的計(jì)算吞吐量和帶寬，能夠讓企業(yè)更快開(kāi)發(fā)機(jī)器學(xué)習(xí)模型。

除了這些，谷歌這次還帶來(lái)售價(jià)1799美元（合人民幣約1萬(wàn)2）的首款折疊屏手機(jī)等新硬件產(chǎn)品，以及接入AI功能的Android 14系統(tǒng)（比如提供信息回復(fù)建議什么的），這里就不一一展示了。

總的來(lái)看，作為第15屆I/O大會(huì)，谷歌這次著實(shí)給大家?guī)?lái)了非常多的干貨。

值得一提的是，這次上臺(tái)介紹的發(fā)言嘉賓，已不見(jiàn)Jeff Dean的身影，他前幾日剛剛職級(jí)變動(dòng)。

作為從前Google AI最代表性發(fā)言的高管，在AI 2.0浪潮里，將何在？

谷歌是否還能在大模型和AI搜索領(lǐng)域中奮起追上，也值得期待。

你對(duì)這次谷歌的反擊，滿意嗎？

責(zé)任編輯：武曉燕來(lái)源：量子位