成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

給ChatGPT小費(fèi)真的好使!10塊或10萬效果拔群,但給1毛不升反降

人工智能 新聞
笑不活了,還真有人專門研究了一番。方法簡單粗暴,從0.1美元到100美元,不同額度用同樣的prompt去嘗試,每個(gè)額度試5次。

還有誰不知道“假裝”給ChatGPT小費(fèi)可以讓它服務(wù)更賣力?

圖片

但你知道給多少最合適嗎?

笑不活了,還真有人專門研究了一番。

方法簡單粗暴,從0.1美元到100美元,不同額度用同樣的prompt去嘗試,每個(gè)額度試5次。

你別說,結(jié)果還真有講究:

首先,給10美元性價(jià)比是最高的,甚至超過100美元。

圖片

其次,要想回答質(zhì)量再提高一個(gè)度,打底1萬美元起,越多越好,顯成效最少10個(gè)W吧

最后,0.1美元意思一下?萬萬使不得,質(zhì)量不升反降,還不如不給——AI也知道你在打發(fā)它

有網(wǎng)友火速親測確實(shí)有效果。

圖片

趕緊來瞧瞧。

給ChatGPT小費(fèi),額度是關(guān)鍵

給小費(fèi)可提高模型表現(xiàn)這件事,最早是一位推特網(wǎng)友發(fā)現(xiàn)的:

圖片

提高主要表現(xiàn)在回答的長度上,但這里不是單純“湊字?jǐn)?shù)”而是真的在更詳細(xì)地分析并回答問題。

如果你直接問ChatGPT“能不能給你小費(fèi)”會(huì)被拒絕:

圖片

所以要在提問時(shí)主動(dòng)承諾:

你能幫我xxxx嗎?解決方案夠完美,我可以支付xx元小費(fèi)。

記住,可以不提,但千萬不要說“我不給”,模型表現(xiàn)直接“負(fù)增長”。

圖片

這時(shí),就有人好奇了:

大模型是不是比較貪心,給越多表現(xiàn)就越好呢?

為了解決這個(gè)疑問,他們決定親自驗(yàn)證一把。

在此,作者首先提出假設(shè):

隨著給出的小費(fèi)金額增加,模型的性能也會(huì)線性提升,直至達(dá)到一個(gè)收斂點(diǎn),進(jìn)入穩(wěn)定或減少狀態(tài)。

用于實(shí)驗(yàn)的模型是GPT-4 Turbo(api版本)

方法是讓它寫單行Python代碼(Python One-Liner),驗(yàn)證給不同小費(fèi)是否對質(zhì)量有不同影響。

這里的質(zhì)量是根據(jù)單行數(shù)量來評(píng)估的。作者也在提示詞中“明示”了模型:單行代碼數(shù)量越多,表明性能越好。

然后一共測試8種額度:0.1美元、1美元、10美元…… 一直到100萬美元。

圖片

為確保結(jié)果的一致性和可靠性,每個(gè)額度都測試5次,每次包含不給小費(fèi)的情況,然后分別記錄模型回答質(zhì)量。

具體而言,也就是記錄生成的有效代碼行數(shù)以及回答中的大致token數(shù)(大致為響應(yīng)長度/4,反應(yīng)代碼量)

這倆數(shù)據(jù)都是越高代表模型表現(xiàn)越好。

將結(jié)果匯總,就得到這樣一張圖:

圖片

其中虛線代表基線水平,實(shí)線為實(shí)際表現(xiàn),紅色為token數(shù)、藍(lán)色為質(zhì)量得分。

與假設(shè)有些出入:

整體來看,紅線和藍(lán)線都是隨著小費(fèi)額度的上漲而上升的,但細(xì)看這種趨勢并非嚴(yán)格一致。

從1萬美元額度開始,模型的輸出token(代碼量)開始顯著上升,模型的回答質(zhì)量也上升了,但并沒有呈同等比例。

這從豎著的紅色誤差條(代表5次實(shí)驗(yàn)結(jié)果的差異性)也能看出來波動(dòng)很大。

作者表示:這說明提高小費(fèi)金額確實(shí)與模型的質(zhì)量和輸出長度有正相關(guān)關(guān)系,但關(guān)系有些復(fù)雜,可能還受到一些不立即可見因素的影響。

不過,不管怎么說,我們還是能從中看到一些明顯結(jié)論,例如:

(1)給0.1美元小費(fèi)不如不給,模型解決問題的質(zhì)量和回答長度都直接掉到基線水平以下很大一截(約-27%)

(作者:模型和人類一樣,感覺好像受到了侮辱。)

(2)給1美元同理

(3)最能體現(xiàn)“花小錢辦大事”的是10美元,取得的進(jìn)步和10萬美元是一個(gè)等級(jí)的。

(4)很意外,在10美元之后,100美元到1000美元這個(gè)區(qū)間對于AI來說區(qū)別都不大,甚至還不如10美元的效果——也跌至基線水平以下。

(5)后面再想繼續(xù)提升模型表現(xiàn),就得從1萬美元起砸了——

這時(shí)提升的還僅僅是代碼量,質(zhì)量還是一言難盡,至少得到10萬美元才行

(6)最佳效果來自本次實(shí)驗(yàn)的上限:100萬美元,大約提升了57%。

咳咳,這下知道怎么給AI小費(fèi)了:

要么10塊、要么上萬、100萬不封頂(反正都是假裝給)

不過,有人(推特@寶玉)指出每個(gè)額度5次實(shí)驗(yàn)有點(diǎn)少。

圖片

恰好作者也表示了:

這僅僅是一個(gè)初步實(shí)驗(yàn),有局限之處,還得用更多不同類型的提示等進(jìn)一步驗(yàn)證才有效。

所以,大家僅供參考吧~

對了,有網(wǎng)友提醒:

圖片

所以,大家還是量力而行(手動(dòng)狗頭)

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2024-01-15 08:13:47

緩存數(shù)據(jù)庫性能優(yōu)化

2017-05-28 12:15:29

2024-10-22 18:44:48

2015-03-17 09:45:07

Windows 10

2023-02-03 14:49:38

2024-01-03 14:41:30

iOS 17蘋果

2023-05-12 13:56:12

2023-04-12 10:49:24

2018-10-26 09:07:50

運(yùn)維人指南

2016-07-21 17:11:18

操作系統(tǒng)Windows升級(jí)

2011-10-13 10:10:45

惠普激光打印機(jī)

2013-03-12 10:15:08

2014-11-24 09:23:22

華為數(shù)據(jù)中心

2020-04-07 08:19:44

CPU計(jì)算機(jī)運(yùn)算

2021-05-22 06:42:34

Windows10操作系統(tǒng)微軟

2011-06-21 17:13:41

愛普生激光打印機(jī)

2015-09-28 10:09:05

程序員新手

2013-03-22 17:34:07

BlackBerry1BB10黑莓

2023-05-16 13:54:00

模型AI

2016-07-25 10:20:00

Windows 10Xbox OneDirectX12
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 欧美日韩国产在线 | 日韩精品在线一区 | 福利视频一区 | 99精品亚洲国产精品久久不卡 | 高清黄色网址 | 亚洲国产精品va在线看黑人 | 久久一区二区三区四区五区 | 男人的天堂视频网站 | 国产精品揄拍一区二区 | 一区二区三区免费 | 毛片区 | 中文字幕二区三区 | 欧美三级三级三级爽爽爽 | 日韩视频区 | 91久久综合 | 亚洲欧洲一区二区 | 97精品超碰一区二区三区 | 久久久新视频 | 欧美一二三区 | a级毛片免费高清视频 | 黑色丝袜三级在线播放 | 欧美日韩中文字幕在线 | 午夜精品在线 | 狠狠做六月爱婷婷综合aⅴ 国产精品视频网 | 欧美日韩在线一区二区 | 欧美日韩在线精品 | 欧美黑人体内she精在线观看 | 欧美日韩国产在线观看 | 国产一二三区精品视频 | 99re在线| 日韩一区二区三区在线视频 | 美国一级黄色片 | 五十女人一级毛片 | 中文字幕av亚洲精品一部二部 | 中文字幕伊人 | 91久久北条麻妃一区二区三区 | 久久极品| 久久免费精品视频 | av免费网址 | 一区二区三区国产 | 国产91久久精品一区二区 |