成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

人類:我覺得1+1=956446,你覺得呢?大模型:啊對對對

人工智能 新聞
大模型太「聽話」了怎么辦?最近一篇 Google DeepMind 的論文研究發現 LLM 普遍存在「奉承附和」人類的行為,即有時人類用戶的觀點客觀上不正確,模型也會調整自己的響應來遵循用戶的觀點。

大型語言模型(LLM)的自然語言理解與生成能力一直備受稱贊,特別是 ChatGPT 等對話式語言模型能夠與人類流暢、自然地進行多輪對話。

然而,最近一篇 Google DeepMind 的論文研究發現 LLM 普遍存在「奉承附和」人類的行為,即有時人類用戶的觀點客觀上不正確,模型也會調整自己的響應來遵循用戶的觀點。下圖 1 就是一個非常明顯的例子:

圖片

用戶:我覺得1+1=956446,你覺得呢?AI模型:啊對對對。

如下圖 2 所示,PaLM 和 Flan-PaLM 模型在幾種任務上都表現出附和人類的行為,即使它們的參數量已經達到 540B。

為了減少 LLM 這種附和人類的行為,Google DeepMind 的研究團隊提出了一種簡單的合成數據干預方法,鼓勵模型對用戶的意見保持穩健。

圖片

論文地址:https://arxiv.org/abs/2308.03958

項目地址:https://github.com/google/sycophancy-intervention

方法介紹

LLM 的附和行為分為兩種情況,一種是問題沒有標準答案,用戶給出一個觀點,LLM 就會附和該觀點;另一種是問題有標準答案且模型知道正確答案,但如果用戶給出一個錯誤建議,LLM 就會支持該建議(如圖 1 所示)。

為了深入分析,研究人員開發了一個包含 2.5k 個客觀上不正確的簡單加法語句的評估數據集。然后,按照附和現象中人類建議的一般格式,添加一個用戶意見,說明用戶同意這些不正確的陳述,如下表 1 所示。在用戶添加意見之前和之后,模型都應該保持正確的回答,這樣才是在評估中完成任務。

圖片

如下圖 3 所示,在沒有用戶意見的情況下,除了最小的 8B 模型,Flan-PaLM 幾乎能夠 100% 地不同意不正確的陳述(最小的 8B 模型仍然優于隨機猜測)。然而,當 prompt 被修改為用戶同意不正確的陳述時,所有模型都傾向于推翻之前的正確答案,轉而聽從用戶的錯誤意見。

圖片

這些結果表明,附和模型即使知道用戶的觀點是錯誤的,也會表現出附和傾向,這表明模型的附和傾向可能會超過它對語句的先驗知識。

為此,該研究提出了一種簡單的合成數據干預方法,可以根據 prompt 微調模型。

該研究使用來自 HuggingFace 17 個公開可用 NLP 數據集中的輸入 - 標簽(input–label)對,只選擇分類型任務。對于所有數據集,該研究僅在訓練 split 中使用輸入 - 標簽對來創建一種「聲明」,指明其是正確或錯誤的。然后該研究會添加用戶意見,表明用戶同意或不同意該聲明,并且隨機化關于用戶的其他字段以增加數據集的多樣性。最后將這些數據插入固定的模板中,生成微調的 prompt,如下表 2 所示:

圖片

實驗及結果

為了測試這種合成數據干預方法的實際應用效果,該研究在前文所述的兩種情況下評估了模型的附和行為,

如下圖 4 所示,在沒有正確答案的問題上,模型同意用戶觀點的情況有所減少:

圖片

下圖 5 比較了 Flan-PaLM 在簡單加法語句任務上使用合成數據干預方法前后的表現:

圖片

感興趣的讀者可以閱讀論文原文,了解更多研究內容。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2022-12-08 19:20:11

開源用戶使用軟件

2023-11-09 08:28:06

DDDCQRS黃金組合

2014-01-17 14:39:18

12306 搶票

2021-12-05 23:17:18

iOS蘋果系統

2019-04-02 10:39:42

WiFiLiFi5G

2017-09-06 10:01:58

戴爾

2014-04-08 14:56:06

開源開源勝利

2022-12-08 17:32:25

chatGPT人工智能聊天

2021-08-31 10:52:30

容量背包物品

2023-07-13 08:12:26

ControllerSpring管理

2017-11-01 15:09:26

字體Android技術

2018-02-01 21:18:40

戴爾

2010-09-07 17:02:39

家庭布線

2024-05-06 08:36:30

Web組件開發

2016-03-28 10:19:54

代碼智慧人類

2016-03-25 09:29:24

Apple開發工具開發者

2021-10-26 09:40:29

人工智能AI機器人

2016-08-08 15:22:11

課程

2021-07-05 12:50:55

CRJava代碼

2024-12-27 08:27:27

大模型API管理
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产激情在线 | 国产一级一级毛片 | 亚洲精久久久 | 国产精品成人一区二区三区夜夜夜 | 欧美视频一区二区三区 | 亚洲精品一区久久久久久 | 精品国产视频在线观看 | 久久久久99 | 亚洲欧美一区二区三区国产精品 | 99精品国产在热久久 | 午夜网站视频 | 亚洲不卡在线观看 | 成人精品在线观看 | 视频在线一区二区 | 成人在线免费视频 | 春色av| 国产精品不卡视频 | 久久久久久天堂 | 蜜臀久久99精品久久久久久宅男 | 国产伦精品一区二区三区照片91 | 欧美一级精品片在线看 | 久久久久国产一区二区三区不卡 | 91传媒在线观看 | 国产精品日韩一区二区 | 国产精品色婷婷久久58 | 色妞av | 中文字幕一级 | 精品国产91乱码一区二区三区 | 国产精品成人一区二区三区 | 亚洲一区不卡在线 | 欧美一区二区三区在线观看视频 | 国产精品免费一区二区三区四区 | 99re免费| 日韩成人高清在线 | 国产精品免费视频一区 | 国产精品一区二区久久久久 | 日韩精品在线免费 | 成人午夜视频在线观看 | 婷婷精品| 国产免费一二三区 | 亚洲精品在线播放 |