成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

被GPT帶飛的In-Context Learning發(fā)展現(xiàn)狀如何?這篇綜述梳理明白了

人工智能 新聞
來自北京大學、上海 AI Lab 和加州大學圣巴巴拉分校的十位研究者近期發(fā)布了一篇關于 in-context learning 的綜述論文。

隨著語言模型和語料庫規(guī)模的逐漸擴大,大型語言模型(LLM)展現(xiàn)出更多的潛力。近來一些研究表明,LLM 可以使用 in-context learning(ICL)執(zhí)行一系列復雜任務,例如解決數(shù)學推理問題。

來自北京大學、上海 AI Lab 和加州大學圣巴巴拉分校的十位研究者近期發(fā)布了一篇關于 in-context learning 的綜述論文,詳細梳理了 ICL 研究的當前進展。

圖片

論文地址:?https://arxiv.org/pdf/2301.00234v1.pdf?

in-context learning 的核心思路是類比學習,下圖描述了語言模型如何使用 ICL 進行決策。

圖片

首先,ICL 需要一些樣例來形成演示語境,這些樣例通常用自然語言模板編寫。然后,ICL 將查詢問題和演示語境相聯(lián)系,形成 prompt,并且將其輸入語言模型進行預測。與監(jiān)督學習需要使用反向梯度更新模型參數(shù)的訓練階段不同,ICL 不需要參數(shù)更新即可使預訓練語言模型直接執(zhí)行預測任務,并且模型有望學習演示樣例中隱藏的模式,并據(jù)此做出正確的預測。

作為一種新的范式,ICL 有很多吸引人的優(yōu)勢。首先,演示樣例用自然語言格式編寫,這為與大語言模型關聯(lián)提供了一個可解釋的接口。通過改變演示樣例和模板(Liu et al., 2022; Lu et al., 2022; Wu et al., 2022; Wei et al., 2022c),這種范式使將人類知識納入語言模型變得更加容易。第二,in-context learning 類似于人類通過類比學習的決策過程。第三,與監(jiān)督式訓練相比,ICL 是一個無需訓練的學習框架。這不僅可以大大降低模型適應新任務的計算成本,而且還可以使語言模型即服務(LMaaS,Sun et al., 2022)成為可能,并輕松應用于大規(guī)模的現(xiàn)實任務。

盡管 ICL 有著大好的前景,但仍存在許多值得探究的問題,包括它的性能。例如原始的 GPT-3 模型就具備一定的 ICL 能力,但一些研究發(fā)現(xiàn),通過預訓練期間的適應,這種能力還可以獲得顯著的提升。此外,ICL 的性能對特定的設置很敏銳,包括 prompt 模板、語境樣例的選擇和樣例順序等。此外,ICL 的工作機制雖然看似合理,但仍不夠清晰明了,能夠初步解釋其工作機制的研究也不多。

本篇綜述論文總結道,ICL 的強大性能依賴于兩個階段:

  • 培養(yǎng)大型語言模型 ICL 能力的訓練階段;
  • 大型語言模型根據(jù)特定任務演示進行預測的推理階段。

在訓練階段,語言模型直接按照語言建模目標進行訓練,例如從左到右的生成。盡管這些模型并沒有專門針對 in-context learning 進行優(yōu)化,但 ICL 的能力依舊令人驚喜。現(xiàn)有的 ICL 研究基本以訓練良好的語言模型為主干。

在推理階段,由于輸入和輸出的 label 都是用可解釋的自然語言模板表征的,因此 ICL 性能可以從多個角度得到優(yōu)化。該綜述論文進行了詳細的描述和比較,并選擇合適的例子進行演示,針對不同的任務設計具體的評分方法。

這篇綜述論文的大致內容和結構如下圖所示,包括:ICL 的正式定義 (§3)、warmup 方法 (§4)、prompt 設計策略 (§5) 和評分函數(shù) (§6)。

圖片

此外,§7 深入闡述了當前為揭開 ICL 背后工作原理所做的探索。§8 進一步為 ICL 提供了有用的評估與資源,§9 介紹了能顯示出 ICL 有效性的潛在應用場景。最后,§10 總結了 ICL 領域存在的挑戰(zhàn)和潛在的方向,為該領域的進一步發(fā)展提供參考。

感興趣的讀者可以閱讀論文原文,了解更多研究細節(jié)。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-01-01 13:31:47

模型訓練

2022-12-27 14:43:15

模型GPT

2014-09-18 09:06:06

SDN

2020-03-30 17:58:14

虛擬機網(wǎng)絡NFV

2022-01-13 10:02:46

PHPWeb語言

2013-03-17 16:50:10

NFC日本

2020-03-09 15:18:34

人工智能AI芯片前景

2009-11-03 09:30:19

NGN接入技術

2019-07-29 14:30:53

自動駕駛汽車行業(yè)無人駕駛

2012-11-20 10:26:52

美國云計算云服務

2015-03-12 15:52:03

2019-05-20 15:12:01

云計算商業(yè)智能AWS

2009-10-19 12:42:18

綜合布線市場

2011-05-23 15:10:16

接入網(wǎng)

2009-10-20 14:23:38

綜合網(wǎng)絡布線系統(tǒng)

2009-12-31 11:00:26

寬帶無線接入技術

2017-12-11 18:13:46

智能轉型數(shù)字化

2009-11-13 13:17:27

策略路由技術

2022-08-11 16:32:45

云計算云服務商

2009-11-19 16:38:33

路由器市場
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩午夜激情 | 在线免费观看a级片 | 狼人伊人影院 | 精品福利一区二区三区 | 精品在线99 | 久久夜视频| 亚洲精品视频在线 | 欧美伦理一区 | 国产福利视频 | 日本在线一区二区 | 91精品国产综合久久久久久蜜臀 | 99久久久久 | 日韩欧美不卡 | 欧美激情综合色综合啪啪五月 | 免费看欧美一级片 | 国产一区二区三区视频免费观看 | 一级片在线观看 | 久久这里有精品 | 国产美女黄色片 | 日韩在线大片 | 亚洲一区二区在线视频 | 国产一区不卡 | 北条麻妃99精品青青久久主播 | 在线不卡一区 | 国产精品18hdxxxⅹ在线 | 国产成人精品网站 | 日韩三区在线 | 7777在线视频 | 国产91 在线播放 | 日韩在线免费视频 | 久久久精品国产 | 久久久久国产视频 | 成人精品影院 | 91视频久久 | 精品三级在线观看 | 国产精品永久在线观看 | 日韩免费一区 | 青青草视频免费观看 | 精品欧美色视频网站在线观看 | 91亚洲精品在线 | 国产精品久久久久久久久久99 |