成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

恕我直言,你的模型可能并沒看懂prompt在說啥

人工智能 開發
in-context learning學習的并不是輸入與標注之間的關聯,而是通過展示數據形式,來激活預訓練模型的能力。

隨著GPT-3等超大模型的興起,in-context learning的形式也流行起來。在in-context learning中,模型不根據下游任務調整參數,而是將下游任務的輸入輸出接起來之后作為prompt,引導模型根據測試集的輸入生成預測結果。該方法的表現可以大幅超越零監督學習,并給大模型高效運用提供了新的思路。

然而,in-context learning中,模型真的學習了下游任務么?作為prompt的訓練樣本,到底是如何讓模型work的?

本文作者發現,in-context learning學習的并不是輸入與標注之間的關聯,而是通過展示數據形式,來激活預訓練模型的能力。此外還有兩個附帶的結論:(1)在meta learning的環境下,in-context learning的這一特點更為明顯;(2)因為標簽不重要,所以可以用無標注領域內數據做in-context zero shot learning。

論文題目:Rethinking the Role of Demonstrations: What Makes In-Context Learning Work?論文鏈接:https://arxiv.org/abs/2202.12837項目地址:https://github.com/Alrope123/rethinking-demonstrations

背景

大規模預訓練模型的無監督預測:對預訓練好的語言模型,輸入測試數據的輸入(x),直接通過語言模型預測輸出(P(y|x))。如下圖所示。其中minimal是最簡單的方式,mannual是加入人工設計的部分。藍色是需要預測的標簽部分。這篇論文中,作者默認采用Minimal的方式處理測試數據。

而in-context learning,類似于上述的無監督預測,但在輸入測試樣例前輸入少量標注數據。同樣不需要參數調整,直接訓練。相當于在無監督預測的基礎上,引入如下前綴:

而本文主要探究的,就是in-context learning中,模型究竟從加入的這段前綴中學到了什么。

實驗設置

本文主要探究了6種不同的預訓練模型,其中,MetaICL采用了大量的下游任務以in-context learning的形式進行了元學習:

對于每個模型,作者采用了兩種應用方式,即direct和channel:

作者一共探究了26個數據集,其中16個分類任務和10個多項選擇任務。

在實驗細節上,作者對于每個instance,展示了16個標注樣例。每組設置(26個數據集6個預訓練模型2組使用方式)用5個隨機數種子跑了5遍。作者在 airseq 13B 和 GPT-3 兩個大模型上,出于算力的考慮只做了6個數據集,和3個隨機數種子。

由于實驗較多,作者一般僅匯報各種均值。

模型沒有學習標簽

這篇文章的第一個結論是:in-context learning中,模型并沒有學習輸入和標簽之間的對應關系。

通過給in-context的訓練樣本賦予隨機標簽,可以構建隨機標注的設置。從下圖中可以看出,無論是分類任務(上),還是多項選擇任務(下),隨機標注設置下(紅)模型表現均和正確標注(黃)表現相當,且明顯超過沒有in-context樣本的zero-shot 設置(藍)。

這一點趨勢,在改變隨機標簽的in-context樣本比例,以及改變in-context樣本數量時,都是保持的。選用人工設計的in-context展示形式(prompt),結論也不發生改變。

下圖調整的是改變隨機標簽的in-context樣本比例。

下圖左邊是Channel MetaICL,右邊是 Direct GPT-J,K調的是展示樣例的數目。

下圖+T表示采用人工設計的in-context展示形式。

模型學習任務形式

這篇文章的第二個結論是:in-context learning中,模型學到(激活)了輸入數據、預測標簽的分布,以及這種數據+label的語言表達形式。

下圖中,青綠色的柱子為用(從外部語料中)隨機采樣的句子替換輸入句子的設置??梢钥吹剑P捅憩F明顯下降。因此,in-context learning中,展示樣本和測試樣本在語料分布上的一致性比較中央。猜測模型很可能學到了展示樣本的語言風格。

下圖中,青綠色的柱子為用隨機詞匯替代展示樣本中的標簽??梢钥吹?,模型表現明顯下降。因此,in-context learning中,展示樣本中的標簽內容與測試樣本的標簽內容的一致性是比較重要的。猜測模型很可能從展示樣本中學到了標簽詞匯的分布。

下圖中,分別用labels only(深紫)和no labels(深綠)來探索展示模式的差異對模型表現的影響??梢钥吹?,模型相對于上面兩圖的OOD setting而言,都有了進一步的下降。這可以表明,除了領域內,輸入和標簽表達方式之外,in-context learning中模型還會學習這種輸入輸出的語言模式。

總結與討論

模型有沒有學習?

作者認為,傳統意義上的學習指模型建模輸入樣本和輸出樣本之間的關聯(P(y|x)或P(x,y)∝P(x|y))。在這種意義下,in-context learning并沒有學習。

然而,模型可以通過展示樣例,中的輸入、輸出、及輸入+輸出的語言表達風格來提升表現。在一定程度上,這種利用前綴輸入激活大模型語言表達建模能力的方式也算是一種學習。

因此,這也表明:大模型零監督能力遠超預期。

畢竟,學習表達形式、語言風格與標簽形式,不需要標注數據的參與。大模型潛在地就具有了這種(分類)能力。

當然,反過來,也表明了in-context learning的局限在于,它不能真正建模輸入和輸出之間的關系,因此在一些輸入輸出之間的關系必然沒有被無監督預訓練任務所建模的下游任務而言,in-context learning很可能失效。

不過,看起來目前大多數傳統NLP的任務都不會滿足上述“失效”設定。

額外的一點啟示

這篇文章的一作 Sewon Min 近期創作了很多相關主題的高質量工作,包括:

  • Noisy Channel Language Model Prompting for Few-Shot Text Classification ~ https://arxiv.org/pdf/2108.04106.pdf
  • MetaICL: Learning to Learn In Context ~ https://arxiv.org/pdf/2110.15943.pdf

平時有些同學做了很多實驗,一到寫論文就什么實驗結果都想往論文里放。

這里還是可以學習一下 Sewon Min。這三篇文章arxiv的時間跨度只有6個月,很多實驗甚至是有overlap的,基本可以判斷為一作同時在做的幾項工作。作者從不同的角度去分割了這些實驗,以不同的匯報方式,講出了三個故事,每個故事看起來都完整且獨立,看起來就很棒。

責任編輯:張燕妮 來源: 夕小瑤的賣萌屋
相關推薦

2021-11-03 07:58:27

異步編程線程

2020-11-27 19:08:51

AI 數據人工智能

2020-02-15 14:34:33

IDEA插件代碼

2022-05-06 08:26:21

babel編譯器

2023-10-20 07:29:16

框架模型Prompt

2024-07-17 09:47:18

2011-07-28 09:15:56

MIUI小米手機雷軍

2024-02-01 08:29:42

大數據計算業務

2025-06-16 14:44:14

模型AILLM

2023-05-20 00:13:22

prompt團隊升職

2025-02-18 10:25:10

2024-08-12 12:30:27

2011-08-31 13:12:36

2024-04-29 09:25:19

2023-11-30 08:15:58

模型結構化

2021-05-26 10:19:01

jreJava應用程序

2019-09-02 08:08:30

緩存HTTP數據庫

2024-06-05 08:29:35

2019-09-10 13:48:12

NLP神經網絡模型

2014-06-19 14:49:37

iCloud認證令牌密碼
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 一区二区日韩 | 在线āv视频 | 国产成人亚洲精品 | 亚洲久久在线 | 激情视频中文字幕 | 北条麻妃一区二区三区在线视频 | 日韩精品一区二区三区在线播放 | 欧美一区二区三区视频 | 亚洲精品性视频 | 成人精品毛片国产亚洲av十九禁 | 国产福利91精品 | 日韩欧美一区二区三区 | 精精国产xxxx视频在线 | 在线一区视频 | 一区二区三区四区在线 | 欧美日韩在线一区二区 | 视频一区二区中文字幕日韩 | 亚洲高清视频在线观看 | 中文字幕在线观看精品 | 国产一级特黄视频 | aaa级片| 日干夜干 | 日韩在线国产 | 99日韩 | 欧美一级二级视频 | 日批免费看 | 亚洲精品一区中文字幕乱码 | 久久久999成人 | 精品久久精品 | 欧洲毛片| 欧美日韩精品一区 | 日韩毛片在线视频 | 国产精品免费一区二区三区四区 | 免费一级黄色电影 | 男女视频91 | 国产视频91在线 | 欧美日韩一区二区三区在线观看 | 欧美一区二区三区四区五区无卡码 | 日韩在线观看精品 | 日韩欧美一区二区三区免费观看 | 国产精品久久久久久久久久久新郎 |