成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<span id="brhhx"><ins id="brhhx"></ins></span>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

GPT-4變笨加劇，被曝緩存歷史回復：一個笑話講八百遍，讓換新的也不聽

2023-11-02 12:21:50

在此，按理說temperature值越大，模型越容易生成一些意想不到的詞，不該重復同一個笑話了。不止如此，即使咱們不動參數，換一個措辭，強調讓它講一個新的、不同的笑話，也無濟于事。

有網友找到了GPT-4變“笨”的又一證據。

他質疑：

OpenAI會緩存歷史回復，讓GPT-4直接復述以前生成過的答案。

圖片

最明顯的例子就是講笑話。

證據顯示，即使他將模型的temperature值調高，GPT-4仍重復同一個“科學家與原子”的回答。

就是那個“為什么科學家不信任原子？因為萬物都是由它們編造/構造（make up）出來的”的冷笑話。

圖片

在此，按理說temperature值越大，模型越容易生成一些意想不到的詞，不該重復同一個笑話了。

不止如此，即使咱們不動參數，換一個措辭，強調讓它講一個新的、不同的笑話，也無濟于事。

圖片

發現者表示：

這說明GPT-4不僅使用緩存，還是聚類查詢而非精準匹配某個提問。

這樣的好處不言而喻，回復速度可以更快。

不過既然高價買了會員，享受的只是這樣的緩存檢索服務，誰心里也不爽。

圖片

還有人看完后的心情是：

如果真這樣的話，我們一直用GPT-4來評價其他大模型的回答是不是不太公平？

圖片

當然，也有人不認為這是外部緩存的結果，可能模型本身答案的重復性就有這么高：

此前已有研究表明ChatGPT在講笑話時，90%的情況下都會重復同樣的25個。

圖片

具體怎么說？

證據實錘GPT-4用緩存回復

不僅是忽略temperature值，這位網友還發現：

更改模型的top_p值也沒用，GPT-4就跟那一個笑話干上了。

（top_p：用來控制模型返回結果的真實性，想要更準確和基于事實的答案就把值調低，想要多樣化的答案就調高）

圖片

唯一的辦法是把隨機性參數n拉高，這樣我們就可以獲得“非緩存”的答案，得到一個新笑話。

圖片

不過，它的“代價”是回復速度變慢，畢竟生成新內容會帶來一定延遲。

值得一提的是，還有人似乎在本地模型上也發現了類似現象。

圖片

有人表示：截圖中的“prefix-match hit” （前綴匹配命中）似乎可以證明確實是用的緩存。

那么問題就來了，大模型到底是如何緩存我們的聊天信息的呢？

好問題，從開頭展現的第二個例子來看，顯然是進行了某種“聚類”操作，但具體如何應用于深度多輪對話咱不知道。

圖片

姑且不論這個問題，倒是有人看到這里，想起來ChatGPT那句“您的數據存在我們這兒，但一旦聊天結束對話內容就會被刪除”的聲明，恍然大悟。

圖片

這不禁讓一些人開始擔憂數據安全問題：

這是否意味著我們發起的聊天內容仍然保存在他們的數據庫中？

圖片

當然，有人分析這個擔憂可能過慮了：

也許只是我們的查詢embedding和回答緩存被存下來了。

圖片

因此，就像發現者本人說的：

緩存這個操作本身我不太擔心。

我擔心的是OpenAI這樣簡單粗暴地匯總我們的問題進行回答，毫不關心temperature等設置，直接聚合明顯有不同含義的提示，這樣影響很不好，可能“廢掉”許多（基于GPT-4的）應用。

圖片

當然，并不是所有人都同意以上發現能夠證明OpenAI真的就是在用緩存回復。

他們的理由是作者采用的案例恰好是講笑話。

畢竟就在今年6月，兩個德國學者測試發現，讓ChatGPT隨便講個笑話，1008次結果中有90%的情況下都是同樣25個笑話的變體。

圖片

像“科學家和原子”這個更是尤其出現頻率最高，它講了119次。

因此也就能理解為什么看起來好像是緩存了之前的回答一樣。

因此，有網友也提議用其他類型的問題測一測再看。

不過作者堅持認為，不一定非得換問題，光通過測量延遲時間就能很容易地分辨出是不是緩存了。

圖片

最后，我們不妨再從“另一個角度”看這個問題：

GPT-4一直講一個笑話怎么了？

一直以來，咱們不都是強調要讓大模型輸出一致、可靠的回答嗎？這不，它多聽話啊（手動狗頭）。

圖片

所以，GPT-4究竟有沒有緩存，你有觀察到類似現象嗎？

參考鏈接： https://twitter.com/hammer_mt/status/1719150885559812379

責任編輯：武曉燕來源：量子位

GPT-4 緩存模型

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：国产精品一区二区福利视频 | 激情一区二区三区 | 黄色大片免费看 | 精品美女久久久 | 欧美理论在线观看 | 国产成人精品午夜 | 一级毛片视频 | 日本成年免费网站 | 免费毛片网站在线观看 | 欧美日韩一区精品 | 中文字幕国产在线 | 999国产视频 | 狠狠操婷婷 | 久久久久国产一区二区三区四区 | 免费黄色的视频 | 日本精品一区二区 | 国产成人精品网站 | 精品欧美二区 | 亚洲精品电影 | 久久久久久国产精品免费免费狐狸 | 色视频网站 | 永久免费视频 | 久久av网 | 国产福利在线播放麻豆 | 91精品国产色综合久久不卡98口 | 亚洲高清免费观看 | 99亚洲视频 | 国产日韩欧美激情 | 国产成人99久久亚洲综合精品 | 超碰在线人 | 99久久婷婷国产综合精品电影 | 色就干 | 精品国产18久久久久久二百 | 亚州精品天堂中文字幕 | 亚洲成人一区二区三区 | 毛色毛片免费看 | 日韩精品四区 | 国产黑丝av| 91麻豆蜜桃一区二区三区 | 在线播放国产一区二区三区 | 亚洲最色网站 |

<font id="yuwql"></font>

<tt id="yuwql"><acronym id="yuwql"></acronym></tt><table id="yuwql"></table>