成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI慘遭打臉!SearchGPT官方演示大翻車,源代碼竟暴露搜索機(jī)制

人工智能 新聞
OpenAI再次上演了谷歌Bard出糗的一幕,SearchGPT官方震撼演示卻被外媒曝出低級錯(cuò)誤。另有神通廣大的開發(fā)者甚至扒出內(nèi)部源碼,揭秘了背后搜索機(jī)制。網(wǎng)友最新一手實(shí)測,AI秒級回復(fù)讓全網(wǎng)驚呆。

SearchGPT發(fā)布剛過兩天,已有人灰度測試到了。

今天,網(wǎng)友Kesku自制的demo全網(wǎng)刷屏,SearchGPT結(jié)果輸出如此神速,讓所有人為之震驚。

圖片

當(dāng)詢問Porter Robinson出了新唱片嗎?

只見,SearchGPT眨眼功夫之間,即刻給出了答案「Smile」,最后還附上了鏈接。

圖片

再來看移動版本的回答速度,回答延遲幾乎為0。

圖片

評論區(qū)下方,震驚體鋪屏。

圖片

但另一方面,OpenAI當(dāng)天放出的官方演示,被外媒《大西洋月刊》曝出其中的問題。

在回答「8月在北卡羅來納Boone舉辦的音樂節(jié)」的問題時(shí),SearchGPT竟弄錯(cuò)時(shí)間,出現(xiàn)了幻覺。

說好的,要取代谷歌呢?

全網(wǎng)一手實(shí)測來了

Kesku自己測試的另一個(gè)demo,呈現(xiàn)了SearchGPT的小部件。

她發(fā)現(xiàn)的一個(gè)現(xiàn)象是,SearchGPT傾向于強(qiáng)烈關(guān)注搜索結(jié)果。

「有時(shí)就需要明確告訴它,自己想要做什么,而不是想從網(wǎng)上得到什么」。

圖片

比如詢問它倫敦天氣,SearchGPT先給出了未來七天的天氣預(yù)報(bào)。

圖片

在倫敦野餐的最佳時(shí)間和地點(diǎn)有什么,類似小部件的形式給出了幾個(gè)備選項(xiàng)。

圖片

Kesku還在移動端測試了一些例子。

圖片

查詢英偉達(dá)股票,會給出英偉達(dá)股票整體的可視化圖,隨后給出了一些分析。所有股票信息都被無縫集成在頁面中。

圖片

輸入一首歌名「Never Gonna Give You Up」,然后直接給出了YouTube歌曲視頻,不用跳轉(zhuǎn)到其他網(wǎng)頁,在一個(gè)頁面就可以聽歌、看視頻。

圖片

除了搜索功能,網(wǎng)友還樂此不疲地進(jìn)行「人性化測試」——

「你怎么樣」?

「作為一個(gè)AI語言模型,我沒有感情,但我在這里并隨時(shí)準(zhǔn)備幫助你解答問題。今天我能為你提供什么幫助」?

圖片

「給我講一個(gè)笑話」

一個(gè)英語世界的經(jīng)典雙關(guān)梗就此出現(xiàn)——

「科學(xué)家不信任原子。為什么科學(xué)家不信任原子?因?yàn)樗鼈儤?gòu)成了一切!」

圖片

網(wǎng)友現(xiàn)場出題

眼饞的網(wǎng)友們,紛紛在評論區(qū)出題,讓帖主幫忙測試。

第一位網(wǎng)友問道,「它支持地區(qū)和新聞嗎,比如來自TestingCatlog的最新新聞」。

圖片

Kesku測試后表示,「它可以通過IP地址或精確位置為你提供本地信息(后者默認(rèn)是關(guān)閉的,可以在設(shè)置中選擇開啟)——比如『我附近的電影院』這樣的查詢效果很好」。

圖片

「幫忙試一下其智能體搜索的解釋能力」。

圖片

SearchGPT在給出關(guān)于高帶寬存儲器的解釋中,藍(lán)色標(biāo)出的內(nèi)容,是參考解釋。

圖片圖片

你能嘗試搜索一些付費(fèi)墻后面的文章嗎?那些最近與OpenAI簽署了合作伙伴關(guān)系的文章。

圖片

Kesku給出了一篇文章的內(nèi)容, 不過貌似還是不能越過付費(fèi)內(nèi)容,僅是給出了文章的總結(jié)。

更細(xì)節(jié)的內(nèi)容,依舊無法看到。

圖片

你能嘗試搜索「Yandex月活躍用戶數(shù)」嗎?

我想看看,當(dāng)它找不到我想要的確切答案時(shí),它是否會承認(rèn)自己找到了日活躍用戶數(shù)(DAU),而不是月活躍用戶數(shù)(MAU),還是會像copilot那樣裝糊涂,只是復(fù)制粘貼整個(gè)搜索結(jié)果而忽視實(shí)際查詢。

圖片

Kesku搜素后的結(jié)果如下所示:

顯然,根據(jù)提問者問題,SearchGPT給出了回答。

圖片

「與Perplexity相比如何」?

Kesku稱暫時(shí)還未測試復(fù)雜的任務(wù),不過非常喜歡目前測出的結(jié)果。

圖片

在下面提示中,她直接問道「誰是Kesku」這么小眾的問題。

沒想到,SearchGPT給出了正確的解答,Perplexity卻回答錯(cuò)誤了。

圖片

圖片

有網(wǎng)友對此評價(jià)道,「很酷的演示!也許SearchGPT能在本地搜索領(lǐng)域帶來一些變革?它能幫助你在現(xiàn)實(shí)世界中完成事情。從外觀來看,它有很好的數(shù)據(jù)源、簡潔的小部件,而且速度超快。不知道與谷歌相比,他們能把每次查詢的成本降低到多少」?

圖片

揭秘SearchGPT搜索機(jī)制

科技媒體TestingCatolog也率先進(jìn)行了內(nèi)測,并揭開了SearchGPT搜索機(jī)制的一角。

圖片

與當(dāng)前ChatGPT提供的通用Bing搜索功能不同,SearchGPT更擅長提供實(shí)時(shí)信息。

雖然仍舊依賴Bing的索引,但SearchGPT將會有自己的網(wǎng)絡(luò)爬蟲(類似Perplexity),用于動態(tài)獲取實(shí)時(shí)數(shù)據(jù),從而克服Bing速度較慢的問題。

甚至,TestingCatalog還挖出了SearchGPT的源代碼,并在評論區(qū)信誓旦旦地表示「絕對準(zhǔn)確,我有內(nèi)部人士?!?/span>

圖片

源代碼不僅露出了Bing的接口,而且可以發(fā)現(xiàn),搜索結(jié)果由多模態(tài)模型提供支持。

雖然看不出其中具體的處理流程,但調(diào)用的模型應(yīng)該具有自動理解圖像的功能。

圖片

官方演示大翻車,OpenAI慘遭打臉

就在網(wǎng)友們興致勃勃地試用時(shí),《大西洋月刊》卻站出來潑了一盆冷水——SearchGPT在官方demo中有明顯的搜索結(jié)果錯(cuò)誤。

用戶給出的搜索問題是「8月在北卡羅來納Boone舉辦的音樂節(jié)」。

圖片

這個(gè)問題其實(shí)很難體現(xiàn)SearchGPT相對于傳統(tǒng)搜索引擎的優(yōu)勢。同樣的問題如果拋給谷歌搜索,也能給出相差無幾的結(jié)果。

比如SearchGPT放在首行的「阿巴拉契亞夏季節(jié)」(An Appalachian Summer Festival),也同樣是谷歌搜索的第二位結(jié)果。

圖片

但尷尬的是,標(biāo)題下方的AI摘要把一個(gè)關(guān)鍵信息弄錯(cuò)了——經(jīng)主辦方確認(rèn),音樂節(jié)舉辦日期為6月29日~7月27日。

如果你按照SearchGPT給出的信息去買票,將一無所獲——7月29日~8月16日恰好是售票處正式關(guān)閉的時(shí)段。

圖片

OpenAI發(fā)言人Kayla Wood已經(jīng)向《大西洋月刊》承認(rèn)了這個(gè)錯(cuò)誤,并表示「這僅是初始的原型,我們將不斷改進(jìn)?!?/span>

這個(gè)錯(cuò)誤讓人不禁想起B(yǎng)ard曾經(jīng)造成的慘劇。

2023年2月,谷歌推出了這個(gè)聊天機(jī)器人產(chǎn)品以對抗ChatGPT,但首次亮相就出現(xiàn)了事實(shí)性錯(cuò)誤,導(dǎo)致Alphabet股價(jià)當(dāng)天暴跌9%,市值瞬間蒸發(fā)1000億美元。

圖片

Bard稱James Webb太空望遠(yuǎn)鏡拍攝了系外行星的第一張照片,但實(shí)際上這個(gè)功績屬于歐洲南部天文臺的VLT

但好在,OpenAI沒有股價(jià)可跌,而且僅開放內(nèi)測的做法也是相當(dāng)謹(jǐn)慎。畢竟有谷歌的前車之鑒,可以預(yù)料到,LLM這種錯(cuò)誤幾乎是無法避免的。

即使OpenAI能夠找到方法大幅減少SearchGPT的幻覺,但面對龐大的訪問量也是「杯水車薪」。

圖片

假設(shè)幻覺率僅為1%(這個(gè)比率很難達(dá)到),按照谷歌的規(guī)模,也會導(dǎo)致每天產(chǎn)生數(shù)千萬個(gè)錯(cuò)誤答案。

更何況,我們目前還沒有發(fā)現(xiàn)足夠可靠且有效的方法,來消除LLM的廢話和幻覺。

而且,Andrej Karpathy大佬曾經(jīng)在推特上表達(dá)過這樣的觀點(diǎn):「幻覺并不是bug,而是LLM最大的特點(diǎn)?!?/span>

圖片

Karpathy將LLM比喻為「夢想機(jī)器」:我們用prompt引導(dǎo)模型「做夢」,再加上對訓(xùn)練文檔的模糊記憶,就得到了生成結(jié)果。

雖然大多數(shù)時(shí)候生成結(jié)果是有用的,但既然是「夢境」就有可能失控。當(dāng)LLM做夢進(jìn)入有事實(shí)錯(cuò)誤的領(lǐng)域時(shí),我們就會給它貼上「幻覺」的標(biāo)簽。

這看起來是個(gè)bug,但LLM只是做了它一直在做的事情。

這種機(jī)制和傳統(tǒng)的搜索引擎完全不同。后者接收提示后僅僅是逐字返回?cái)?shù)據(jù)庫中最相似的文檔,因此你可以說它有「創(chuàng)造性問題」,因?yàn)樗阉饕嬗肋h(yuǎn)不可能創(chuàng)造新的回應(yīng)。

根據(jù)Karpathy的說法,我們就很難指望由當(dāng)前LLM驅(qū)動的AI搜索能生成100%真實(shí)準(zhǔn)確的結(jié)果。

那么這場搜索引擎的變革會怎樣展開?LLM的「夢境創(chuàng)意」和傳統(tǒng)搜索引擎的真實(shí)可靠,究竟是共存下去,還是會「你死我亡」?

圖片

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2023-02-09 16:09:46

2024-07-26 09:29:38

2024-07-26 08:22:41

2024-07-26 13:42:01

OpenAIAISearchGPT

2023-09-29 18:46:06

谷歌AI代碼

2024-07-29 14:22:13

2023-12-09 14:30:50

2009-07-03 14:33:47

2022-09-20 11:23:51

黑客GTA 6游戲

2024-04-30 08:42:17

2023-02-09 09:57:53

微軟谷歌

2025-06-17 08:52:00

蘋果AI論文

2024-03-14 18:14:03

2011-06-14 09:37:11

TouchPad惠普

2024-03-28 13:04:24

2023-06-06 17:48:35

罷工人工智能AI

2021-12-23 09:38:07

微軟圖像加密

2025-06-10 09:25:27

2023-11-29 14:41:33

GPT-4OpenAI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 中文字幕色站 | 久久精品小短片 | www.久久精品 | 91久久国产综合久久 | av日韩一区| 日韩国产黄色片 | 国产一区二区精品 | 91久久久久久久 | 午夜网站视频 | 欧美日韩不卡在线 | 中文字幕成人av | 婷婷久久精品一区二区 | www.夜夜骑| 久久久国产一区二区三区 | 国产成人自拍av | 涩涩导航| 国产成人精品在线播放 | 一二区成人影院电影网 | 国产精品久久久久一区二区三区 | 国产精品一区视频 | 精品久久久久久 | xx性欧美肥妇精品久久久久久 | 日韩一区二区三区在线视频 | 国产高清视频一区 | 日韩在线播放一区 | av在线黄| 日韩毛片在线视频 | 欧美在线色视频 | 国产h视频 | 91精品国产综合久久久久久蜜臀 | 日本一区二区在线视频 | 亚洲 精品 综合 精品 自拍 | 亚洲欧美日本在线 | 精品视频在线免费观看 | 日韩超碰 | 久久久亚洲成人 | 日韩中文字幕免费在线 | 欧美亚洲一级 | 97日韩精品 | 国产91丝袜在线播放 | 欧美精品久久 |