成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

DiffMoE:動態(tài)Token選擇助力擴(kuò)散模型性能飛躍,快手&清華團(tuán)隊打造視覺生成新標(biāo)桿!

人工智能 新聞
近期,可靈團(tuán)隊推出 DiffMoE(Dynamic Token Selection for Scalable Diffusion Transformers),通過創(chuàng)新的動態(tài)token選擇機(jī)制和全局token池設(shè)計,拓展了擴(kuò)散模型的效率與性能邊界。

本文由清華大學(xué)和快手可靈團(tuán)隊共同完成。第一作者是清華大學(xué)智能視覺實驗室在讀本科生史明磊。

在生成式 AI 領(lǐng)域,擴(kuò)散模型(Diffusion Models)已成為圖像生成任務(wù)的主流架構(gòu)。然而,傳統(tǒng)擴(kuò)散模型在處理不同噪聲水平和條件輸入時采用統(tǒng)一處理方式,未能充分利用擴(kuò)散過程的異構(gòu)特性,導(dǎo)致計算效率低下,近期,可靈團(tuán)隊推出 DiffMoE(Dynamic Token Selection for Scalable Diffusion Transformers),通過創(chuàng)新的動態(tài)token選擇機(jī)制和全局token池設(shè)計,拓展了擴(kuò)散模型的效率與性能邊界。

null

核心突破:動態(tài)token選擇與全局上下文感知 

DiffMoE 首次在擴(kuò)散模型中引入批級全局token池(Batch-level Global Token Pool),打破傳統(tǒng)模型對單一樣本內(nèi)token的限制,使專家網(wǎng)絡(luò)能夠跨樣本訪問全局token分布。這種設(shè)計模擬了完整數(shù)據(jù)集的token分布,顯著提升了模型對復(fù)雜噪聲模式的學(xué)習(xí)能力。實驗表明,DiffMoE 在訓(xùn)練損失收斂速度上超越了同等參數(shù)量的密集模型(Dense Models),為多任務(wù)處理提供了更強(qiáng)大的上下文感知能力。 

針對推理階段的計算資源分配問題,DiffMoE 提出動態(tài)容量預(yù)測器(Capacity Predictor),通過輕量級 MLP 網(wǎng)絡(luò)實時調(diào)整專家網(wǎng)絡(luò)的計算負(fù)載。該機(jī)制基于訓(xùn)練時的token路由模式學(xué)習(xí),在不同噪聲水平和樣本復(fù)雜度間智能分配資源,實現(xiàn)了性能與計算成本的靈活權(quán)衡。例如,在生成困難圖片時自動分配更多計算資源,而在處理簡單圖像時降低負(fù)載,真正做到 「按需計算」。 

null

性能提升:以少勝多的參數(shù)高效模型

在 ImageNet 256×256 分類條件圖像生成基準(zhǔn)測試中,其他結(jié)構(gòu)細(xì)節(jié)保持一致的公平對比情況下,DiffMoE-L-E8 模型僅用 4.58 億參數(shù) (FID50K 2.13), 超越了擁有 6.75 億參數(shù)的 Dense-DiT-XL 模型(FID 2.19)。通過進(jìn)一步擴(kuò)展實驗,DiffMoE 實現(xiàn)了僅用 1 倍激活參數(shù)就實現(xiàn)了 3 倍于密集模型的性能。此外,DiffMoE 在文本到圖像生成任務(wù)中同樣展現(xiàn)出卓越的泛化能力,相較于 Dense 模型有明顯效率提升。

null

null

多維度驗證:從理論到實踐

研究團(tuán)隊通過大規(guī)模實驗驗證了 DiffMoE 的優(yōu)越性: 

動態(tài)計算優(yōu)勢:DiffMoE 的平均激活參數(shù)量較低的情況下實現(xiàn)了性能指標(biāo)的顯著提升,證明了動態(tài)資源分配的高效性;同時,DiffMoE 能夠根據(jù)樣本的難度自動分配計算量。本研究可視化了模型認(rèn)為最困難和最簡單的十類生成。

null

模型認(rèn)為的最困難的十類

null

模型認(rèn)為的最簡單的十類

擴(kuò)展性測試:從小型(32M)到大型(458M)配置,DiffMoE 均保持性能正向增長,專家數(shù)量從 2 擴(kuò)展到 16 時 FID 持續(xù)下降;

null

跨任務(wù)適配:在文本到圖像生成任務(wù)中,DiffMoE 模型在對象生成、空間定位等關(guān)鍵指標(biāo)上全面超越 Dense 基線模型。 

null

總結(jié)

在這項工作中,研究團(tuán)隊通過動態(tài)token選擇和全局token可訪問性來高效擴(kuò)展擴(kuò)散模型。我們的方法利用專門的專家行為和動態(tài)資源分配,有效解決了擴(kuò)散 Transformer 中固定計算量處理的局限性問題。大量的實驗結(jié)果表明,DiffMoE 在性能上超越了現(xiàn)有的 TC-MoE 和 EC-MoE 方法,以及激活參數(shù)量是其 3 倍的密集型模型。研究團(tuán)隊不僅驗證了它在類別條件生成任務(wù)中的實用性,也驗證了 DiffMoE 在大規(guī)模文本到圖像生成任務(wù)的有效性。雖然為了進(jìn)行公平比較,我們未納入現(xiàn)代混合專家(MoE)模型的改進(jìn)方法,但在未來的工作中,集成諸如細(xì)粒度專家和共享專家等先進(jìn)技術(shù),將可能帶來新的增益。

更多細(xì)節(jié)請參閱原論文。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2024-02-26 08:25:00

模型訓(xùn)練

2024-03-28 13:19:05

AI數(shù)據(jù)

2015-09-11 09:48:56

存儲華為

2025-02-10 08:40:00

訓(xùn)練數(shù)據(jù)模型

2025-05-27 15:35:02

大模型技術(shù)AI

2023-12-23 23:08:21

語音數(shù)據(jù)

2017-12-20 17:11:27

華為

2025-06-13 14:13:26

3D場景生成模型

2016-01-19 17:12:40

創(chuàng)新ICT華為

2011-11-18 21:33:48

2025-04-08 09:16:00

推理模型AI

2025-01-16 14:18:14

2025-07-02 09:21:30

2023-05-11 15:24:41

代碼模型

2025-03-03 10:17:00

模型數(shù)據(jù)生成

2015-02-02 17:11:58

IBMSaaS云計算

2014-09-22 15:42:18

云安全騰訊云

2017-04-11 09:30:46

互聯(lián)網(wǎng)

2019-07-23 16:31:44

華為
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 成人精品久久日伦片大全免费 | 亚洲一区精品在线 | 中文字幕日韩欧美一区二区三区 | 久草综合在线 | 日韩免费视频一区二区 | 日本三级做a全过程在线观看 | 特黄特黄a级毛片免费专区 av网站免费在线观看 | 欧美 中文字幕 | 日韩在线大片 | 国产一区二区三区久久 | 亚洲欧美网 | 亚洲综合色视频在线观看 | 国产精品一二区 | 欧美一区二区三区在线看 | 国产综合久久 | 九九热在线观看 | www.欧美视频 | 美女视频三区 | 国产精品久久免费观看 | 中文字幕一区二区在线观看 | 91大神在线资源观看无广告 | 青青激情网 | 午夜精品导航 | 日韩在线免费看 | 精品www| 久久久久久国产精品 | 精品91久久| 高清一区二区三区 | 亚洲精品福利在线 | 国产欧美在线视频 | 午夜av一区二区 | 亚洲免费在线视频 | 国产精品久久久久一区二区三区 | 色资源在线 | 97精品超碰一区二区三区 | 国产在线视频一区二区董小宛性色 | 日本韩国电影免费观看 | 日本黄色片免费在线观看 | 四虎影视在线 | 亚洲精品视频免费观看 | 国产精品美女在线观看 |