成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

提示工程夭折?MIT斯坦福讓大模型主動提問,自己搞明白你想要什么

人工智能 新聞
論文提出了一種新型的機器學習框架,能讓大模型學會主動向人類提問,自己搞明白用戶的偏好。

我就說嘛,提示工程正在消失,這篇新研究即可解釋原因。

AI圈百萬粉絲大V的一條推特,可把大家給驚到了。

圖片

要知道,提示工程可是ChatGPT趨勢中的大熱詞。由它衍生出的新崗位提示工程師年薪可高達幾十萬美元,“未來人人都要學會提示工程”的觀點更是引發熱議……

結果現在,提示工程就開始消失了???

而且有理有據。

博主伊森·莫利克提到的這篇論文,由MIT、斯坦福和Anthropic(Claude2打造者)共同提出。

論文提出了一種新型的機器學習框架,能讓大模型學會主動向人類提問,自己搞明白用戶的偏好。

他們使用GPT-4進行實驗,結果發現和提示工程、監督學習等方法比,在這個框架的輔助下GPT-4在多個任務上更懂人類了。

如果大模型能更容易揣度出人類想啥,也就意味著人類自己不用絞盡腦汁表達自己的想法了。

所以伊森·莫利克覺得,這不就不用每個人都去學習提示工程了么?

圖片

有網友補充說,這是不是說某種程度上,我們未來是不是可以不用語言和LLM進行交流。讓大模型通過提問來弄清楚我們在想什么,這真是一個巨大的進步。

圖片

讓AI來提示你

具體來看,這項研究提出了一種新型學習框架GATE(Generative active task elicitation)。

它能基于大模型本身的能力,來引出、推理人類用戶的喜好。

研究團隊將這稱為一種更主動的方式,具體表現形式就是讓大模型來對用戶提問,以讓人類的偏好想法能更加明確地被表達出來。

圖片

對應來看,監督學習和提示工程都屬于被動的方式,監督學習和少量主動學習還要基于示例。

圖片

為什么要“反客為主”提示人類?

因為人類給出的提示存在局限性,不一定能準確完整表達出自己的喜好。

比如很多人都不懂提示工程;或者在提示過程中提供了存在誤導性的資料……這些都會導致大模型表現變差。

論文中列舉了一個例子。假如一個用戶說自己很喜歡讀網球相關的文章,對網球巡回賽、發球技術感興趣。但是從他提供的文章參考里,無法判斷他是否對網球方面的其他話題感興趣。

所以,如果大模型能學會一些提問技巧,就能將用戶的偏好鎖定在更小范圍內

本項研究讓大模型嘗試了多種提問方式,比如主動生成用戶標注的樣本、是非類提問、開放式提問等。

主要測試的任務為內容推薦、道德推理和郵箱驗證。

結果顯示,在三項任務中,GATE包含的辦法效果都優于其他方法

使用這一框架的大模型,使用起來也不那么“燒腦”了(如下左圖)

以及這種方法的引入也不會影響人類用戶本來的偏好(如下右圖)

圖片

作者認為更大的模型可能是更好的引導者,實驗中他們使用的是GPT-4。

如醫療、法律等需要做出復雜決策的領域,會是GATE框架未來拓展的方向。

本項工作由MIT、Anthropic和斯坦福學者聯合推出。

圖片

“我們現在仍依賴提示工程”

而以這篇研究為核心,也引發了一波關于提示工程的討論。

并不是所有人都贊同“提示工程正在消失”這一觀點。

另一位AI圈大V elvis就表示,這篇研究和之前那些研究人類偏好的工作沒有太大不同,我們現在還是要依賴提示工程。

我不認為“理解人類意圖/喜好”會導致提示工程消失,除非LLM訓練和工作的方式發生系統性變化。

圖片

也有人覺得提示工程只是會從前端消失,形式上發生改變。

圖片

還有人提問,要是提示工程消失了,那花重金雇傭提示工程師的人可咋辦?

圖片

不過回到研究本身,的確提示工程對于很多人來說還是有難度,有網友覺得,這是阻礙很多人擁抱ChatGPT的一大原因。

圖片

你覺得呢?

論文地址:https://arxiv.org/abs/2310.11589

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-12-08 13:22:00

數據模型

2022-07-14 15:08:23

AI模型

2023-09-06 13:34:31

2024-11-21 08:39:08

2023-07-07 17:03:23

AI智能

2024-01-29 12:49:00

AI模型

2023-05-04 12:32:28

模型研究

2024-04-24 09:47:36

2012-03-21 21:38:27

蘋果

2009-05-19 09:06:41

Apple斯坦福iPhone

2013-01-31 09:45:14

斯坦福超級電腦百萬內核

2023-03-22 15:14:00

數據模型

2023-02-14 09:45:11

模型測試

2019-12-16 14:33:01

AI人工智能斯坦福

2025-06-10 11:22:38

AIChatGPT壓縮

2021-03-04 14:50:11

計算機互聯網 技術

2024-09-26 10:23:46

2021-03-05 10:57:33

AI 數據人工智能

2021-03-10 14:48:27

人工智能

2022-02-23 14:36:31

AI數據研究
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 狠狠干在线 | 一级做a爰片久久毛片 | 999久久久| av手机在线免费观看 | 亚洲精品视频播放 | 成人影院午夜 | 亚洲一区 中文字幕 | 午夜一区二区三区视频 | 亚洲精品黄 | 色综合色综合网色综合 | 国产真实精品久久二三区 | 久久精品色视频 | 日本一道本视频 | 久久久av | 亚洲精品久久久久久久久久久久久 | 精品成人在线 | 国产精品国产精品国产专区不片 | 91成人免费观看 | av免费看片 | 成人av激情 | 日韩视频a | 久久免费视频1 | 欧美在线小视频 | 精品无码久久久久久久动漫 | 国产精品久久久久久久久久免费 | xx视频在线观看 | 九九精品在线 | 欧美日韩在线观看一区 | 亚洲精品福利视频 | 精品国产欧美 | 免费看大片bbbb欧美 | 亚洲精品中文字幕在线 | 久久这里只有精品首页 | 欧美一区二区三区在线免费观看 | 亚州精品天堂中文字幕 | 久久久精彩视频 | 欧美日韩一区精品 | 亚洲精品一区二区冲田杏梨 | 国产一区二区三区在线 | 99热视 | 欧美日韩一区在线观看 |