成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

能勝任統計學家?Transformers超強學習機制「自動算法選擇」

人工智能 新聞
Salesforce AI Research、北京大學和 UC 伯克利合作的最新論文,發現 Transformer 模型在上下文中學習(in-context learning)的新機制:「自動算法選擇」,類似統計與機器學習專家能夠現實完成的工作。

ChatGPT 等基于 Transformer 的大語言模型具備極強的在上下文中學習(In-Context Learning,ICL)的能力:輸入少量示例樣本,即能夠正確回答同類問題。如何理解這種 ICL 能力?

本文作者實驗發現并證明一種 ICL 的新機制:自動算法選擇,可以允許單一 Transformer 模型在不同輸入數據上選擇執行完全不同的,適合該數據的學習算法,類似統計與機器學習專家能夠現實完成的工作。基于量化的 Transformer 構造,文章一并給出 Transformer 實現 ICL 的一套全面的統計理論,包含近似精度,預測表現,以及預訓練的樣本復雜度。

圖片圖片

論文地址:https://arxiv.org/abs/2306.04637

Transformer 能在 ICL 中完成機器學習任務

ChatGPT 等基于 Transformer 的大模型可以根據輸入的文本,自上下文中學習。如何系統地理解這種能力?NeurIPS 2022 的一篇論文(Garg et al. 2022)考察了 Transformer 從上下文中進行機器學習任務的能力。

將 N 個訓練樣本與 1 個測試樣本 (x_1, y_1, …, x_N, y_N, x_{N+1}) 作為一個序列輸入 Transformer,要求 Transformer 輸出 y_{N+1}。這些樣本來自簡單的統計模型,例如線性模型,但每個序列由不同的模型參數(w_\star)生成。Transformer 如果想總是正確地預測 y_{N+1},那么就需要從訓練樣本中學習真正的參數 w_\star,并利用其進行預測。

Garg et al. 發現,訓練好的 Transformer 總是能夠精準地預測 y_{N+1},并且預測表現能夠媲美該數據上的最優算法。例如線性模型上,Transformer 的預測效果可以媲美最小二乘法(Least Squares),稀疏線性模型上媲美 Lasso,決策樹上能超過 Gradient Boosting。

圖片圖片

Figure 1: Transformer 能在 ICL 中完成機器學習任務 (Garg et al. 2022)

Transformer 雖然在各個任務中實現最優算法,然而這些算法都只是標準的機器學習算法,遠不能完全解釋 ChatGPT 等大模型強大的 ICL 能力。還存在更強的機制嗎?

自動算法選擇

現實生活中,統計學家與機器學習專家會如何分析數據?給定一個數據集,統計學家會先確定數據的結構,規模等,然后根據數據的特點選擇最適合的算法。如果不確定哪個算法合適,則會同時嘗試多個算法,然后利用驗證集(validation split)或交叉驗證(cross-validation)等選擇表現最好的算法。

本文作者發現,Transformer 也能夠進行類似的自動算法選擇。自動算法選擇允許一個單獨的 Transformer 模型,在不同的 ICL 問題上選擇不同的算法,類似統計學家可以現實完成的工作。

作者給出兩種一般的算法選擇機制,從理論上證明 Transformer 模型可以實現這兩個機制,并且實驗上驗證了 Transformer 能夠近似實現這兩種機制,達到了比單一機器學習算法更強的效果。

機制 1:用驗證集做算法選擇

在這一機制中,Transformer 先將輸入數據分為訓練集和驗證集。接下來在訓練集上同時執行 K 個算法,然后在驗證集上測試 K 個算法的表現,最終用表現最好的算法 k_star 給出預測。

Figure 2: 用驗證集做算法選擇(右)及實例(左)。Figure 2: 用驗證集做算法選擇(右)及實例(左)。

應用這一機制,Transformer 可以完成一大類算法選擇。如下圖當中,通過恰當的預訓練,Transformer 可同時實現在兩個帶不同正則化的 ridge regression 算法,并對具體數據分布實現較優的那個算法。進一步,對這一任務,我們在理論上也能夠證明 Transformer 能夠近似整個任務的 Bayes 最優表現。

圖片Figure 3: 單一 Transformer 可以在兩個帶不同噪音的線性模型中同時接近最優。在每個模型中,Transformer 的預測都接近該模型上 Bayes 最優算法(帶不同正則化的 ridge regression)。

機制 2:提前對數據分布進行檢驗

在這一機制中,Transformer 通過提前檢驗數據分布(如計算一些統計量),來決定恰當的算法。例如在下圖當中,單一的 Transformer 可以在回歸問題上實現回歸算法(如線性回歸),在分類問題上實現分類算法(如 Logistic Regression)。

Figure 4: 提前對數據分布進行檢驗(右)及實例(左)。Figure 4: 提前對數據分布進行檢驗(右)及實例(左)。


圖片

Figure 5: 單一 Transformer 可以同時在回歸問題和分類問題上接近最優表現:在回歸問題上表現接近最小二乘法,在分類問題上接近 Logistic Regression。

理論框架

除了自動算法選擇,本文的另一大貢獻是給出了 Transformer 進行 ICL 的一套完整的統計學習理論,涵蓋

  • Transformer 如何實現各種機器學習算法的具體構造,如最小二乘法,Lasso,ridge regression,解廣義線性模型的凸優化算法,神經網絡上的梯度下降法等;
  • 對上述 Transformer 大小(層數、attention head 個數、權重矩陣的范數)的精確界;
  • 上述 Transformer 在標準統計假設下,在 ICL 中的預測表現;
  • Transformer 實現自動算法選擇時類似的保證;
  • 通過預訓練 Transformer 達到上述效果的樣本復雜度。

這套理論給出了 Transformer 進行 ICL 的一整套分析框架。作者相信這一框架可以推廣到一大類相關問題當中,給出類似的理論保證。

結語

本文從理論和實驗上發現 Transformer 模型在 ICL 中能夠進行自動算法選擇,并給出了一整套進行 ICL 的理論框架。

基于本文的結論還有很大的探索空間,例如其它進行 ICL 或自動算法選擇的機制;在 ICL 中逼近 Bayes 最優表現的其它機制;預訓練的 Transformer 如何實現算法選擇的內部機理;對其它 ICL 任務的分析。作者相信,對這些問題的進一步探索,能對大模型有更多有趣的發現。

作者簡介

本文作者 Yu Bai 現任 Salesforce Research 資深研究科學家。Fan Chen 本科畢業于北京大學,即將博士入學麻省理工大學。Huan Wang、Caiming Xiong 分別現任 Salesforce Research 研究主管及副總裁。Song Mei 現任 加州大學伯克利統計系助理教授。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2015-08-28 09:41:24

統計

2017-04-12 09:34:30

數據科學家統計學家好習慣

2011-06-14 17:03:03

QML Qt

2019-06-10 06:22:40

編碼數據科學代碼

2014-08-14 08:55:11

2020-08-28 13:49:13

數據統計學面試

2017-04-20 08:51:15

SPSST檢驗F檢驗

2019-04-09 09:00:01

數據科學代碼編寫

2019-07-03 15:21:47

數據科學統計數據數據結構

2016-09-22 16:30:17

ITPythonSQL queries

2024-03-14 13:46:41

深度學習人工智能

2019-08-19 09:31:47

數據機器學習統計學習

2011-05-13 14:26:08

程序員

2020-04-24 12:50:50

AI算法機器學習

2019-11-26 11:19:40

統計數據互聯網

2023-08-24 17:14:05

統計學

2020-11-02 17:34:22

數據分析人工智能技術

2010-10-19 15:01:01

2015-08-17 09:43:08

2024-05-30 07:34:42

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久婷婷国产香蕉 | 91中文视频| www日韩欧美 | 久久久久久久久久久一区二区 | 天天射天天干 | caoporn国产精品免费公开 | 国产精品日韩一区二区 | 日本视频在线播放 | www.夜夜骑 | 中文字幕国产精品 | 国产一区二区三区 | 欧美在线视频一区二区 | 免费观看一区二区三区毛片 | 国产成人精品在线 | 中文字幕在线一区二区三区 | 久久久久国产 | 国产97色 | 桃花av在线 | 午夜影院视频 | 国产精品一区久久久 | 成人中文字幕在线 | 玖玖视频 | 亚洲国产一区二区三区在线观看 | 欧美精品1区 | 亚洲精品一区二区三区蜜桃久 | 在线观看视频亚洲 | 色婷婷久久久亚洲一区二区三区 | 欧美日韩视频 | 九九久久精品视频 | 亚洲一区二区三区视频 | 亚洲v区| 日日夜夜精品免费视频 | 中文字幕加勒比 | 久久99蜜桃综合影院免费观看 | 国产精品视频一区二区三区 | 欧美精品久久 | caoporn国产精品免费公开 | 成人免费在线视频 | 亚洲久久在线 | 高清久久久 | 亚洲精品久久久久久国产精华液 |