成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI把GPT-4原始版給了他們:研究不微調只靠提示詞能走多遠

人工智能
免微調對齊,讓剛出爐的預訓練模型不止會“文本補全”,只從提示詞中學會和用戶對話、跟隨指令,一直是業界關注的研究方向。目前的SOTA方法URIAL來自艾倫研究所,使用系統提示詞+少數風格示例就能達到不錯的效果。

除了OpenAI自己,居然還有別人能用上GPT-4-Base版??

也就是未經微調的預訓練版,還不會對話聊天,只會補全句子的模型。

EPFL(瑞士洛桑聯邦理工)團隊申請到了訪問權限,用于研究“上下文學習足以讓大模型跟隨指令嗎?”。

圖片

也就是不用監督微調、也不用RHLF或其他強化學習對齊方法,只靠提示詞能走多遠?

預訓練模型,究竟能不能一步登天,直接改造成聊天機器人或AI助手?

圖片

如果可行,將大大降低類ChatGPT大模型的開發難度。

免微調對齊靠譜嗎?

免微調對齊,讓剛出爐的預訓練模型不止會“文本補全”,只從提示詞中學會和用戶對話、跟隨指令,一直是業界關注的研究方向。

目前的SOTA方法URIAL來自艾倫研究所,使用系統提示詞+少數風格示例就能達到不錯的效果。

圖片

但EPFL團隊發現,URIAL仍無法完全彌補與指令微調模型的差距,尤其在多輪對話中的表現更差一些。

實驗中,在Llama系列、Mistral系列和一般人接觸不到的GPT-4-Base都觀察到這種現象。

其中GPT-4-Base的API訪問權限從OpenAI Researcher Access Program項目中申請到。

圖片

EPFL團隊從這里出發,嘗試了各種辦法來提升上下文學習的效果。

首先他們增加示例的數量,但發現幫助不大,沒有隨著例子數目增加性能就提升的趨勢。這一點跟圖像分類、機器翻譯等任務還不太一樣。

圖片

然后他們使用了貪心搜索算法,從一大堆示例中選擇最佳的添加到上下文。

這種方法可以進一步提高性能,但與指令微調模型的差距仍然存在,特別是在 AlpacaEval 2.0基準測試中。

圖片

此外他們還發現,貪心搜索為某個特定模型找到的最佳示例,對于其他模型不能可靠地遷移。

也就是說,不同的示例適合不同的模型

圖片

團隊還進行了一系列消融實驗,以更多地了解上下文學習的工作原理。

他們發現,在MT-Bench這樣的綜合評測中,示例包含正確的“問題-答案對”至關重要

這與此前大模型在分類任務中,只要有大量示例,部分標簽錯了也無所謂的發現非常不同。

圖片

所以最終得出的結論是:

即使采用更多復雜的改進方法,完全縮小上下文學習和指令微調之間的差距也有挑戰,即使對于非常長上下文的大模型也是如此。

論文最后分析,大語言模型可能通過上下文學習只學會了如何模仿例子里的回答風格,但還沒有真正理解執行指令的邏輯。

指令跟隨任務相對還是比較復雜和開放的,沒那么容易掌握。

想讓AI助手更“聽話”,暫時還是很難有捷徑可走。

論文地址:

https://arxiv.org/abs/2405.19874。

參考鏈接:
[1]https://x.com/maksym_andr/status/1796574297894318136。

責任編輯:姜華 來源: 量子位
相關推薦

2023-05-29 09:29:52

GPT-4語言模型

2024-04-22 08:25:00

2023-12-09 13:24:40

OpenAIChatGPT人工智能

2023-04-09 16:17:05

ChatGPT人工智能

2023-07-07 09:32:57

GPT-4OpenAI

2024-07-02 13:25:22

2023-12-17 22:04:04

微軟GPT-4

2024-05-28 14:40:00

2023-06-19 08:19:50

2023-08-06 08:06:30

OpenAIChatGPTGPT-4

2023-03-16 17:28:59

技術AI

2023-09-06 16:44:03

2023-07-20 12:16:31

GPT-4AI

2023-05-05 10:17:00

計算機開源

2025-04-16 09:35:03

2024-07-22 09:01:20

2023-03-16 08:13:56

人工智能?OpenAI

2023-06-08 11:27:10

模型AI

2024-06-28 13:40:03

2023-06-01 12:46:46

GPT-4數學OpenAI
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲天堂网站 | 成人在线观看免费爱爱 | 国产精品一区二区三区99 | 成人午夜激情 | 久久久91| 精品在线观看一区二区 | 亚洲网站在线观看 | 日韩av在线一区二区三区 | 亚洲一级黄色 | 99精品电影| 久久久性色精品国产免费观看 | 久久久99精品免费观看 | 欧美激情一区二区三区 | 亚洲黄色一区二区三区 | 影音先锋久久 | 男女视频在线观看 | 成人av观看 | 欧美成人精品一区二区男人看 | 美女黄18岁以下禁止观看 | 国产成人免费视频 | 国产一区二区久久 | 免费高清成人 | 一级欧美一级日韩片 | 日韩电影中文字幕在线观看 | 欧美精品 在线观看 | 毛片免费观看 | 久草成人| 中文字幕视频在线观看 | 日韩国产精品一区二区三区 | 国产精品国产精品国产专区不片 | 黄色一级免费 | 爱操av | 一级黄色片在线看 | 中文字幕亚洲精品 | 三级在线视频 | 亚洲一区二区三区四区五区午夜 | 日韩另类视频 | 久久久久久国产 | 国产精品视频导航 | 日韩一级免费看 | 日韩电影一区二区三区 |