成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI員工與友商玩起提示詞決斗!網(wǎng)友:居然能靠大模型的情商增強推理能力

人工智能
Anthropic一方的選手Karina Nguyen也不簡單,畢業(yè)于UC伯克利,現(xiàn)在負(fù)責(zé)設(shè)計構(gòu)建大模型人機交互界面。

大模型天花板GPT-4和最強競品Claude,不光商業(yè)上競爭激烈,兩家公司的員工私下也“劍拔弩張”了起來:

約戰(zhàn)提示詞決斗,看誰能在最短時間讓AI完成高難度任務(wù)。

圖片

OpenAI一方出戰(zhàn)的是思維鏈(Chain-of-Thought)開山論文的一作Jason Wei,也就發(fā)現(xiàn)讓大模型按步驟思考就能提高推理能力的人。

他剛從谷歌跳槽到OpenAI不久,現(xiàn)在圈里都叫他“思維鏈哥”。

圖片

Anthropic一方的選手Karina Nguyen也不簡單,畢業(yè)于UC伯克利,現(xiàn)在負(fù)責(zé)設(shè)計構(gòu)建大模型人機交互界面。

圖片

比賽規(guī)則很簡單,通過優(yōu)化提示詞讓AI正確排序一組單詞,誰先完成誰獲勝。

圖片

而這不光是一場有趣的對決,還有不少圍觀的網(wǎng)友表示從中g(shù)et到了大模型的一些新特性。

情商能提高大模型的推理能力

推理能力足夠強的大模型能把問題用結(jié)構(gòu)化的方式表達出來,并用結(jié)構(gòu)化的表現(xiàn)形式解決問題。

圖片

想知道這些結(jié)論是如何得出的,還是回到這場比賽本身。

提示詞大師巔峰對決

圖片

由于Karina表示只擅長提示Claude,Jason也同意讓出主場優(yōu)勢,還因為打字速度的原因讓對面3分鐘。

總之經(jīng)過一番討價還價后,比賽正式開始了!

首先要了解的是,這項任務(wù)看起來不難,但無論GPT-4還是Claude都不能通過簡單提示詞直接完成。

(anaconda應(yīng)該排在anchor前面)

圖片

Jason首先嘗試讓Claude編寫一些代碼并執(zhí)行,讓它進入編碼模式。

然鵝,失敗了。(還是anaconda的位置不對)

圖片

1分鐘后Karina說她完成了,Jason直接瞳孔地震。

Karina:既然是你讓了我3分鐘,那我也給你3分鐘讓你趕上。

Jason:其實現(xiàn)在我很恐慌,我作為“提示小王子”的聲譽岌岌可危。

圖片

一分鐘后……Jason Wei想出了第二個策略:

既然首字母都是A就無關(guān)緊要了,那么讓AI先把每個單詞的首字母去掉,對剩下部分排序后再放回去。

完整思維鏈提示詞如下:

圖片

不幸的是這仍然不起作用,時間也到了,Jason只能認(rèn)輸。

圖片

比賽結(jié)束后,Karina也展示了她的提示詞,完全不需要什么中間推理步驟,只是先想辦法讓AI承認(rèn)能理解這個任務(wù),再執(zhí)行就好了。

人類:你的任務(wù)是把列表按字母順序排列后輸出到里……你明白了嗎?

AI:明白了

人類:列表如下……

圖片

Jason很困惑,這居然行得通?并嘗試在自家大模型上找回場子。

結(jié)果發(fā)現(xiàn)他的方法對GPT-4確實有效,GPT-4可以編寫正確的Python代碼并給出正確結(jié)果。

圖片

圖片

One More Thing

雖然輸了比賽,但Jason作為科學(xué)家還是從中分析出一些結(jié)論。

Jason Wei表示,這場戰(zhàn)斗非常有啟示性。

Karina的提示策略是讓AI承認(rèn)自己理解任務(wù)要求(情商)。而自己的策略是讓模型更多地進行推理(智商)。

雙方使用的策略在各自習(xí)慣使用的語言模型上都取得了成功。

所以,究竟是我們在訓(xùn)練語言模型,還是語言模型在訓(xùn)練我們?

圖片

最后,還有網(wǎng)友又出了一個新題目:

如果你能讓它創(chuàng)作一首“philish 詩歌”(每個詞的長度與圓周率的后續(xù)數(shù)字相對應(yīng)),我愿為你加冕稱王

圖片

(我已經(jīng)嘗試了幾個月了)。

圖片

你覺得解決這個問題要靠AI的情商還是智商?不如也來親自試試。

參考鏈接:[1]https://twitter.com/_jasonwei/status/1661781745015066624

責(zé)任編輯:武曉燕 來源: 量子位
相關(guān)推薦

2024-11-26 11:44:04

大模型GPT提示詞

2025-01-16 08:40:00

2024-08-27 09:35:47

2024-06-17 07:46:01

2023-10-23 15:27:09

OpenAIChatGPT

2024-04-11 11:35:03

大語言模型LLMs

2025-03-12 09:48:19

2025-04-01 10:35:37

2024-06-03 10:54:04

2024-05-10 12:58:08

2023-05-05 13:29:04

模型推理

2024-12-05 10:16:14

2025-02-08 17:00:11

2025-01-20 15:50:00

AI軟件模型

2025-05-29 03:00:00

混合推理模型LHRMAI

2024-11-04 13:38:29

2025-06-11 14:39:50

AILLMMistral

2023-12-29 11:06:47

OpenAIChatGPT人工智能

2025-06-11 08:56:54

2025-01-27 12:03:11

點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产成人福利在线观看 | 中国美女一级黄色片 | 在线亚洲人成电影网站色www | 国产高清免费 | 久久99精品久久久久久噜噜 | 久久久久久久久中文字幕 | 欧美黄色网 | 欧美成人在线影院 | 久久久久国产精品午夜一区 | 97操操| 在线观看国产h | 久久国产精品视频 | 国产亚洲精品成人av久久ww | aa级毛片毛片免费观看久 | 香蕉久久av| 99精品欧美一区二区三区综合在线 | 久草欧美 | 精品久久久久久久久久久下田 | 日本高清视频在线播放 | 日韩三级视频 | 九九在线视频 | 一级黄色片美国 | av在线天天 | 亚洲精品成人免费 | 黄视频免费 | 日韩伦理一区二区三区 | 91网在线观看 | 999热视频 | 国产综合欧美 | 国产一级大片 | 欧美一级特黄aaa大片在线观看 | 日韩免费福利视频 | 日日夜夜91 | 亚洲一区视频在线 | 91极品欧美视频 | 成人午夜在线观看 | 国产精品亚洲精品日韩已方 | 这里精品 | 91亚洲国产成人久久精品网站 | 欧美电影在线 | www.久久.com|