成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Apple:使用語言模型的自回歸方式進行圖像模型預訓練

人工智能
在GPT等大模型出現后,語言模型這種Transformer+自回歸建模的方式,也就是預測next token的預訓練任務,取得了非常大的成功。

1、背景

在GPT等大模型出現后,語言模型這種Transformer+自回歸建模的方式,也就是預測next token的預訓練任務,取得了非常大的成功。那么,這種自回歸建模方式能不能在視覺模型上取得比較好的效果呢?今天介紹的這篇文章,就是Apple近期發表的基于Transformer+自回歸預訓練的方式訓練視覺模型的文章,下面給大家展開介紹一下這篇工作。

圖片圖片

論文標題:Scalable Pre-training of Large Autoregressive Image Models

下載地址:https://arxiv.org/pdf/2401.08541v1.pdf

開源代碼:https://github.com/apple/ml-aim

2、模型結構

模型結構整體采用Transformer,優化目標采用語言模型中的next token prediction。在模型結構上,主要的修改有3個方面。首先是相比ViT這種雙向attention,本文使用的是GPT這種單向attention,即每個位置的元素只能和前面的元素計算attention。

圖片圖片

其次是引入了prefix,在Transformer前面的輸入加了多個prefix token,這部分token使用的是雙向attention。這個主要作用是預訓練和下游應用的一致性,下游都是類似ViT的雙向attention使用方法,預訓練增加prefix雙向attention,可以讓模型適應下游任務。

圖片圖片

最后是在模型最終輸出MLP層的優化。原來的預訓練方法,一般會丟棄掉MLP層,在下游finetune使用一個新的MLP,防止預訓練的MLP過于傾向于預訓練任務導致下游任務效果下降。而本文中,作者采用的方法是每個patch都使用一個獨立的MLP,對于圖像整體的表征,也采用各個patch保證和attention融合的方式,代替一般的pooling,提升預訓練MLP head在下游任務的可用性。

在優化目標上,文中嘗試了兩種方法,第一種是直接擬合patch像素,用MSE進行預測。第二種是提前對圖像patch進行tokenize,轉換成分類任務,用交叉熵損失。不過在文中后續的消融實驗中發現,第二種方法雖然也可以讓模型正常訓練,但是效果并不如基于像素粒度MSE的效果更好。

3、實驗結果

文中的實驗部分詳細分析了這種基于自回歸的圖像模型的效果,以及各個部分對于效果的影響。

首先,隨著訓練的進行,下游的圖像分類任務效果越來越好了,說明這種預訓練方式確實能學到良好的圖像表征信息。

圖片圖片

在訓練數據上,使用小數據集的訓練會導致overfitting,而使用DFN-2B雖然最開始驗證集loss較大,但是沒有明顯的過擬合問題。

圖片圖片

對于模型各個模塊的設計方式,文中也進行了詳細的消融實驗分析。

圖片圖片

在最終的效果對比上,AIM取得了非常不錯的效果,這也驗證了這種自回歸的預訓練方式在圖像上也是可用的,可能會成為后續圖像大模型預訓練的一種主要方式。

圖片 圖片

責任編輯:武曉燕 來源: 圓圓的算法筆記
相關推薦

2017-08-09 10:02:12

NMT神經網絡自然語言處理

2025-06-24 03:00:00

2025-06-19 10:09:55

2023-01-11 07:28:49

TensorFlow分類模型

2023-03-28 16:01:01

PytorchSimCLR算法

2023-02-01 09:46:29

2024-04-26 12:51:48

2022-11-24 17:00:01

模型ARDL開發

2025-04-21 08:20:00

視覺模型訓練

2022-03-04 19:07:03

模型視覺人工智能

2024-01-03 18:53:13

語言模型LLM

2017-12-26 13:53:31

深度學習遷移學習

2024-11-04 00:24:56

2024-11-12 13:10:49

2024-09-26 16:51:23

2023-11-27 15:34:51

大語言模型PubMedBERT

2023-06-12 07:50:45

2024-01-18 10:57:35

AIM模型NLP

2024-05-23 16:56:58

2022-03-14 10:53:12

谷歌模型研究
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 一级毛片视频 | 五月婷婷 六月丁香 | 免费国产黄网站在线观看视频 | 久久日韩精品一区二区三区 | 精品一区二区三区在线播放 | 国产亚洲一区二区三区在线观看 | 一呦二呦三呦国产精品 | 精品国产91亚洲一区二区三区www | 免费一区二区 | 国产成人午夜电影网 | 91九色网站 | 伊人精品国产 | 欧美成人免费电影 | 日韩免费视频一区二区 | 婷婷在线视频 | 欧美三级三级三级爽爽爽 | www.蜜桃av.com| 毛片黄片免费看 | 亚洲欧美日韩精品久久亚洲区 | 手机在线一区二区三区 | 丁香婷婷成人 | 一区二区三区免费 | 99久久婷婷国产综合精品 | 免费黄色日本 | 亚洲小视频在线观看 | 天天操天天操 | 伊人色综合久久天天五月婷 | 99精品国产一区二区青青牛奶 | 高清视频一区二区三区 | 国产成人精品一区二区三区 | 成人欧美一区二区三区黑人孕妇 | 国产精品久久久久久久久久 | 欧美精品一区二区三区蜜桃视频 | 中文字幕视频一区 | 国产色网站 | 久久久精品 | 成人免费在线观看 | www.887色视频免费 | 色www精品视频在线观看 | 欧美精品一区二区三区四区 在线 | 久久精品国产一区二区三区不卡 |