成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

何愷明新作:簡單框架達成無條件圖像生成新SOTA!與MIT合作完成

人工智能 新聞
這個框架結構非常簡單但效果拔群,直接在ImageNet-1K數據集上實現了無條件圖像生成的新SOTA。

大佬何愷明還未正式入職MIT,但和MIT的第一篇合作研究已經出來了:

他和MIT師生一起開發了一個自條件圖像生成框架,名叫RCG(代碼已開源)

這個框架結構非常簡單但效果拔群,直接在ImageNet-1K數據集上實現了無條件圖像生成的新SOTA

圖片

它生成的圖像不需要任何人類注釋(也就是提示詞、類標簽什么的),就能做到既保真又具有多樣性。

圖片

這樣的它不僅顯著提高了無條件圖像生成的水平,還能跟當前最好的條件生成方法一較高下。

用何愷明團隊自己的話來說:

有條件和無條件生成任務之間長期存在的性能差距,終于在這一刻被彌補了。

那么,它究竟是如何做到的呢?

類似自監督學習的自條件生成

首先,所謂無條件生成,就是模型在沒有輸入信號幫助的情況下直接捕獲數據分布生成內容。

這種方式比較難以訓練,所以一直和條件生成有很大性能差距——就像無監督學習比不過監督學習一樣。

但就像自監督學習的出現,扭轉了這一局面一樣。

在無條件圖像生成領域,也有一個類似于自監督學習概念的自條件生成方法。

相比傳統的無條件生成簡單地將噪聲分布映射到圖像分布,這種方法主要將像素生成過程設置在從數據分布本身導出的表示分布上

它有望超越條件圖像生成,并推動諸如分子設計或藥物發現這種不需要人類給注釋的應用往前發展(這也是為什么條件生成圖像發展得這么好,我們還要重視無條件生成)

現在,基于這個自條件生成概念,何愷明團隊首先開發了一個表示擴散模型RDM

它主要用于生成低維自監督圖像表示,方法是通過自監督圖像編碼器從圖像中截取:

圖片

它的核心架構如下:

首先是輸入層,它負責將表征投射到隱藏維度C,接著是N個全連接塊,最后是一個輸出層,負責把隱藏層的潛在特征重新投射(轉換)到原始表征維度。

其中每一層都包含一個LayerNorm層、一個SiLU層以及一個線性層。

圖片

這樣的RDM具有兩個優點:

一是多樣性強,二是計算開銷小。

接著,利用RDM,團隊就提出了今天的主角:表示條件圖像生成架構RCG。

它是一個簡單的自條件生成框架,由三個組件組成:

一個是SSL圖像編碼器,用于將圖像分布轉換為緊湊的表示分布。

一個是RDM,用于對該分布進行建模和采樣。

最后是一個像素生成器MAGE,用于根據表示來處理圖像像。

MAGE的工作方式主要是向token化的圖像中添加隨機掩碼,并要求網絡以從同一圖像中提取的表示為條件來重建丟失的token。

圖片

最終,測試表明,這個自條件生成框架雖結構簡單但效果非凡:

在ImageNet 256×256上,RCG實現了3.56的FID和186.9的IS(Inception Score)得分。

相比之下,在它之前最厲害的無條件生成方法FID分數為7.04,IS得分為123.5。

圖片

以及,相比條件生成,RCG也絲毫不遜色,可以達到相當甚至超過該領域基準模型的水平。

最后,在無分類器引導的情況下,RCG的成績還能進一步提高到3.31(FID)和253.4(IS)

團隊表示:

這些結果表明,自條件圖像生成模型擁有巨大潛力,可能預示這一領域新時代的到來。

團隊介紹

本文一共三位作者:

圖片

一作是MIT博士生黎天鴻,本科畢業于清華姚班,研究方向為跨模態集成傳感技術。

他的主頁很有意思,還專門放了一個菜譜合集——做研究和做飯是他最熱愛的兩件事。

圖片

另一位作者是MIT電氣工程與計算機科學系(EECS)教授、MIT無線網絡和移動計算中心主任Dina Katabi,她是今年斯隆獎的獲得者,并已當選美國國家科學院院士。

圖片

最后,通訊作者為何愷明,他將在明年正式回歸學界、離開Meta加入MIT電氣工程和計算機科學系,與Dina Katabi成為同事。

圖片

論文地址:https://arxiv.org/abs/2312.03701

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-05-21 13:53:49

模型生成AI

2023-07-31 11:20:18

AI研究

2024-06-24 08:10:00

2024-03-25 10:15:58

AI數據

2025-02-26 11:14:10

2025-06-26 08:56:59

2025-02-21 09:40:00

模型訓練數據

2023-03-10 13:05:17

AI就職

2025-06-26 09:00:37

2025-06-20 09:14:00

2024-10-21 11:15:00

2025-03-24 09:08:00

2025-06-05 13:35:33

MeanFlowFIDDDPM

2024-10-06 12:32:42

2022-05-31 10:34:04

研究訓練模型

2025-03-12 14:46:06

2025-02-26 13:23:08

2023-11-02 12:37:25

訓練數據

2025-06-26 15:10:22

DeepMindAI工程團隊
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美在线一级 | 国产精品一区二区福利视频 | 99精品在线观看 | 日韩在线精品 | 精品久久久久久久久久久下田 | 91porn成人精品 | 色伊人久久 | 自拍第1页 | 超碰人人插 | 国产一区二区三区不卡av | 国产一二三区在线 | 爱操影视| 人人艹人人爽 | 中文字幕一区二区三区日韩精品 | 国产精品久久久久久一区二区三区 | 美女张开腿露出尿口 | 免费a国产 | 日韩av免费在线观看 | 欧美精品一区二区免费 | 日日干夜夜操天天操 | 国产日韩欧美精品一区二区 | 成年网站在线观看 | 日韩三片| 国产精品一区二区三区在线 | 三区在线 | 成人午夜在线 | 欧美激情综合 | 国产精品麻 | 91中文字幕 | 麻豆精品久久 | 国产一区二区精品在线观看 | 久色| 国产成人精品免费视频大全最热 | 国产欧美精品一区二区 | 久久久久久久久久久成人 | 色嗨嗨| 在线免费观看a级片 | www日韩 | 四虎在线观看 | 一区二区三区欧美 | 男人的天堂久久 |