成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

零樣本學習超越CLIP!谷歌提出首個多模態稀疏化模型LIMoE,還能降低計算成本

人工智能 新聞
谷歌帶來最新成果LIMoE,首次將稀疏化方法用在了圖像文本混合模型上。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

多模態模型常見,但是基于稀疏化的還是頭一個。

谷歌帶來最新成果LIMoE,首次將稀疏化方法用在了圖像文本混合模型上。

要知道,隨著大模型參數呈指數級增加,訓練成本也是一路飆升。

所以如何降低訓練成本,成為了目前學界重點關注的一個問題。

谷歌想到的辦法,不是拼硬件,而是從模型本身入手。

利用稀疏化的方法,讓每次輸入只需激活部分網絡就能完成任務。

它們在模型內部設置了很多“專家”,每個“專家”只需處理對應部分的輸入,根據任務情況按需使用“專家”就好。

這樣一來,盡管模型容量很大,但是計算成本并沒有暴增

圖片

而且還不會降低性能。

新方法LIMoE零樣本學習任務中,可是直接超越了CLIP。

怪不得網友高呼:

快分享給我們API!

圖片

讓不同“專家”處理不同任務

對于深度學習來說,能同時處理文本圖像任務其實已經不稀奇。

不過過去常見的多模態學習方法,往往是單個輸入就需要激活整個網絡。

谷歌這次提出的新方法,最大亮點就是首次在這一領域采用了稀疏化模型

稀疏化的方法便是無需讓整個模型來處理所有的輸入。

通過對神經網絡進行劃分,它讓神經網絡也“專業對口”,不同的子模型只處理固定類型的任務或數據。

但也不是完全割裂開來,模型內部仍有可共享的部分。

此次基于的模型是MoE(Mixture-of-Experts layer),它被稱為專家混合模型。

也就是在Transformer架構的基礎上,加設了“專家層”。

它是一個并行的FNN,取代了原本的前饋網絡。

這里的“專家”,也就是模型內部的不同子模型。

每個子模型專門用于不同的輸入。

每一層中的專家由門控網絡控制,該網絡根據輸入數據激活專家。

對于每個標記,門控網絡選擇最合適的專家來處理數據。

圖片

此次新提出的LIMoE,其實就是讓MoE能同時處理圖像文本

具體來看,就是讓LIMoE進行對比學習。

在利用大量圖像-文本對訓練時,網絡內部的圖像模型提取圖像表示,文本模型提取文本表示。

針對相同的圖像-文本對,模型會拉近圖像和文本表示的距離。

反之,對于不同的圖像-文本對,則會讓相應的表示彼此遠離。

這樣一來的直接好處,就是能實現零樣本學習

比如一張圖像的表示更接近文本“狗”的表示,那么它就會被歸類為狗。

這種思路可以擴展到數千種情況。

實際上,CLIP和ALIGAN采用的都是這個思路,它們在ImageNet數據集上的精度分別是76.2%、76.4%。

而LIMoE-L/16可以達到78.6%,已經超過了CLIP。

未經過預訓練的LIMoE H/14則能達到84.1%的精度。

圖片

圖片

而在LIMoE的專家層中,谷歌表示還發現了一些有趣的現象。

比如在訓練設置中,圖像標記比文本標記要多很多,因此所有專家都會在在任務中多少處理些圖像。

只不過有的會主要處理圖像,有的主要處理文本,或者二者兼具。

還有在大多數情況下,都會有一個專家來處理所有包含文本表示的圖像patch。

圖片

除了性能上的提升,使用稀疏化模型的好處還體現在降低計算成本上。

因為“多專家”的模式意味著,盡管多設了很多子模型,模型容量顯著增加,但是實際計算成本并沒有明顯變化。

如果一次任務中只使用了一個子模型,那它的成本和標準Transformer的差不多。

比如LIMoE-H/14總共有5.6B參數,但是通過稀疏化,它只會使用每個token的675M參數。

One More Thing

稀疏化模型一直是谷歌深度研究的一個方向,已經提出了MoE、GLaM在內的多個模型。

這次LIMoE也不是谷歌第一次魔改MoE。

去年6月,他們提出了V-MoE,是一種新型的視覺架構,今年已將全部代碼開源。

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-02-06 11:25:50

2023-10-30 15:06:00

模型數據

2010-05-14 09:02:03

云計算成本

2021-10-25 09:06:29

模型人工智能計算

2022-05-23 14:55:40

云計算工具成本

2021-07-24 10:19:14

AI 數據克隆

2013-04-01 09:17:12

ARM通用計算性能

2021-09-08 17:23:33

谷歌模型開發

2022-02-18 13:46:05

云計算混合云技巧

2020-06-09 11:16:42

云計算云平臺工具

2021-07-15 10:30:08

谷歌強化學習AI

2022-07-17 13:07:26

模型開源

2023-02-03 16:31:02

模型

2025-02-07 10:10:05

MusicMagus擴散模型音樂編輯

2021-10-21 15:20:35

智能自動化Science

2024-06-25 09:35:04

模型訓練

2024-09-12 12:46:36

2021-05-08 13:36:13

云計算AWS云平臺

2013-04-24 09:44:19

云計算成本模式云計算成本云計算成本分析

2022-08-08 09:47:09

AI算法模型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 北条麻妃99精品青青久久主播 | 精品91久久 | 亚洲午夜小视频 | 亚洲一区二区精品视频 | 欧美精品一区二区在线观看 | 日本久久黄色 | 欧美黄色免费网站 | 9999精品视频 | 玖玖精品视频 | 日韩视频中文字幕 | 男人天堂手机在线视频 | 亚洲成在线观看 | 亚洲国内精品 | 91久久精品日日躁夜夜躁欧美 | 伊人网伊人 | 国产精品五区 | 日韩成人在线电影 | 国产精品亚洲精品 | av片网 | 一区二区电影 | 欧美99久久精品乱码影视 | 亚洲欧美国产精品久久 | 夜夜骚视频| 亚洲人a| 成人性视频免费网站 | 本道综合精品 | 国产激情视频网 | 老妇激情毛片免费 | 日韩中文字幕免费在线观看 | 成人不卡视频 | 亚洲www啪成人一区二区 | 中文字幕在线三区 | 色久五月 | 欧美日韩在线视频一区 | 国产精品成人国产乱一区 | 精品久久久网站 | 久久九七 | 久久久久一区二区 | 午夜丰满少妇一级毛片 | 久久精品视频9 | 日韩一区二区福利视频 |