成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

何愷明新作再戰AI生成:入職MIT后首次帶隊,奧賽雙料金牌得主鄧明揚參與

人工智能 新聞
傳統觀點認為,圖像生成的自回歸模型通常伴隨著矢量量化(Vector Quantization),比如DALL·E一代就使用了經典的VQ-VAE方法。

何愷明入職MIT副教授后,首次帶隊的新作來了!

圖片

讓自回歸模型拋棄矢量量化,使用連續值生成圖像。并借鑒擴散模型的思想,提出Diffusion Loss

圖片

他加入MIT后,此前也參與過另外幾篇CV方向的論文,不過都是和MIT教授Wojciech Matusik團隊等合作的。

這次何愷明自己帶隊,參與者中還出現一個熟悉的名字:

鄧明揚,IMO、IOI雙料奧賽金牌得主,在競賽圈人稱“乖神”。

圖片

目前鄧明揚MIT本科在讀,按入學時間推算現在剛好大四,所以也有不少網友猜測他如果繼續在MIT讀博可能會加入何愷明團隊。

接下來具體介紹一下,這篇論文研究了什么。

借鑒擴散模型,大改自回歸生成

傳統觀點認為,圖像生成的自回歸模型通常伴隨著矢量量化(Vector Quantization),比如DALL·E一代就使用了經典的VQ-VAE方法。

但團隊觀察到,自回歸生成的本質是根據先前的值預測下一個token,這其實與值是離散還是連續沒啥必然聯系啊。

關鍵是要對token的概率分布進行建模,只要該概率分布可以通過損失函數來測量并用于從中抽取樣本就行。

圖片

并且從另一個方面來看,矢量量化方法還會帶來一系列麻煩:

  • 需要一個離散的token詞表,需要精心設計量化的目標函數,訓練困難,對梯度近似策略很敏感
  • 量化誤差會帶來信息損失,導致還原圖像質量打折
  • 離散token適合建模分類分布,有表達能力上的局限

那么有什么更好的替代方法?

何愷明團隊選擇在損失函數上動刀,借鑒近年大火的擴散模型的思想,提出Diffusion Loss,消除了離散tokenizer的必要性。

如此一來,在連續值空間中應用自回歸模型生成圖像就可行了。

圖片

具體來說,它讓自回歸模型輸出一個潛變量z作為條件,去訓練一個小型的去噪MLP網絡。

通過反向擴散過程,這個小網絡就學會了如何根據z去采樣生成連續值的token x。擴散的過程天然能建模任意復雜的分布,所以沒有類別分布的局限。

這個去噪網絡和自回歸模型是端到端聯合訓練的,鏈式法則直接把損失傳給自回歸模型,使其學會輸出最佳的條件z。

圖片

這篇工作的另一個亮點,是各種自回歸模型的變體都適用。它統一了標準的自回歸AR、隨機順序的AR、以及何愷明擅長的掩碼方法。

其中掩碼自回歸(MAR)模型,可以在任意隨機位置同時預測多個token,同時還能和擴散損失完美配合。

在這個統一的框架下,所有變體要么逐個token預測,要么并行預測一批token,但本質上都是在已知token的基礎上去預測未知token,都是廣義的自回歸模型,所以擴散損失都能適用。

圖片

通過消除矢量量化,團隊訓練的圖像生成模型獲得了強大的結果,同時享受序列建模的速度優勢。

論文在AR、MAR的各種變體上做了大量實驗,結果表明擴散損失比交叉熵損失穩定帶來2-3倍的提升。

與其他領先模型一比也毫不遜色,小模型都能做到1.98的FID分數,大模型更是創下了1.55的SOTA。

圖片

而且它生成256x256圖像速度也很快,不到0.3秒一張。這得益于自回歸生成本來就很快,比擴散模型少采樣很多步,再加上去噪網絡又很小。

圖片

最后總結一下,這項工作通過自回歸建模token間的相關性,再搭配擴散過程對每個token的分布進行建模。

這也有別于普通的潛空間擴散模型中用單個大擴散模型對所有token的聯合分布建模,而是做局部擴散,在效果、速度和靈活性上都展現出了巨大的潛力。

當然,這個方法還有進一步探索的空間,團隊提出,目前在在某些復雜的幾何圖形理解任務上還有待提高。

何愷明團隊都有誰

最后再來介紹一下即將或可能加入何愷明課題組的團隊成員。。

Tianhong LI(黎天鴻),清華姚班校友,MIT博士生在讀,將于2024年9月加入何愷明的課題組,擔任博士后。

圖片

Mingyang Deng(鄧明揚),MIT本科數學和計算機科學專業在讀。

他在高一獲得IMO金牌,高三獲得IOI金牌,是競賽圈為數不多的雙料金牌得主,也是IOI歷史上第三位滿分選手。

目前鄧明揚的研究重點是機器學習,特別是理解和推進生成式基礎模型,包括擴散模型和大型語言模型。

不過他的個人主頁上還沒有透露下一步計劃。

圖片

One More Thing

何愷明當初在MIT的求職演講備受關注,其中提到未來工作方向會是AI for Science,還引起圈內一陣熱議。

圖片

現在,何愷明在AI4S方向的參與的首篇論文也來了:強化學習+量子物理學方向

把Transformer模型用在了動態異構量子資源調度問題上,利用自注意力機制處理量子比特對的序列信息。并在概率性環境中訓練強化學習代理,提供動態實時調度指導,最終顯著提升了量子系統性能,比基于規則的方法提高了3倍以上。

圖片

這樣一來,何愷明在自己的成名領域CV和探索新領域AI4S上都沒耽誤,兩開花,兩開花。

論文:https://arxiv.org/abs/2406.11838

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-12-03 13:40:31

2025-06-26 09:00:37

2023-07-31 11:20:18

AI研究

2023-12-08 14:14:00

模型訓練

2024-04-11 12:30:40

2025-05-21 13:53:49

模型生成AI

2025-02-26 11:14:10

2023-08-16 15:50:00

科學計算

2024-03-25 10:15:58

AI數據

2025-03-13 09:39:05

AImox生成

2025-06-20 09:14:00

2023-03-10 13:05:17

AI就職

2024-10-06 12:32:42

2025-06-13 08:53:00

2025-03-24 09:08:00

2025-06-26 08:56:59

2023-11-20 21:56:57

入職微軟

2025-02-21 09:40:00

模型訓練數據

2025-06-26 15:10:22

DeepMindAI工程團隊

2023-11-02 12:37:25

訓練數據
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91玖玖 | 免费性视频 | 夜夜爽99久久国产综合精品女不卡 | 亚洲一区二区中文字幕在线观看 | 国产日韩一区二区三免费 | 精品视频在线观看 | 国产成人影院 | 国产成人精品一区二区三区网站观看 | 国产精品黄色 | 一区二区在线 | 国产精品 亚洲一区 | 久久精品国产一区二区 | 亚洲欧洲日韩精品 中文字幕 | 日本一区二区视频 | 国产综合在线视频 | 视频精品一区二区三区 | 免费在线观看一区二区三区 | 国产欧美在线播放 | 欧美精品一区三区 | 中文字幕亚洲精品 | 色偷偷噜噜噜亚洲男人 | 日韩欧美在线观看视频 | 夜夜骑综合 | 精品一区二区三区在线观看 | 久久久久1 | 男人天堂999 | 一区二区三区免费 | 在线观看av网站 | 日韩免费高清视频 | 日韩av一区二区在线观看 | 精品国产高清一区二区三区 | 国产精品久久久久免费 | 免费一区二区在线观看 | 98久久 | 国产精品国产a | 亚洲日本欧美日韩高观看 | 日韩精品免费视频 | 久久日韩精品 | 欧美日韩在线观看一区二区三区 | 亚洲福利一区二区 | 国产精品v |