成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

幾行代碼穩(wěn)定UNet ! 中山大學等提出ScaleLong擴散模型:從質(zhì)疑Scaling到成為Scaling

人工智能 新聞
本文提出了擴散模型中UNet的long skip connection的scaling操作可以有助于模型穩(wěn)定訓練的分析,目前已被NeurIPS 2023錄用。同時,該分析還可以解釋擴散模型中常用但未知原理的1/√2 scaling操作能加速訓練的現(xiàn)象。

在標準的UNet結(jié)構(gòu)中,long skip connection上的scaling系數(shù)圖片一般為1。

然而,在一些著名的擴散模型工作中,比如Imagen, Score-based generative model,以及SR3等等,它們都設置了圖片,并發(fā)現(xiàn)這樣的設置可以有效加速擴散模型的訓練。

質(zhì)疑Scaling然而,Imagen等模型對skip connection的Scaling操作在原論文中并沒有具體的分析,只是說這樣設置有助于加速擴散模型的訓練。

首先,這種經(jīng)驗上的展示,讓我們并搞不清楚到底這種設置發(fā)揮了什么作用?

另外,我們也不清楚是否只能設置圖片,還是說可以使用其他的常數(shù)?

不同位置的skip connection的「地位」一樣嗎,為什么使用一樣的常數(shù)?

對此,作者有非常多的問號……

圖片圖片

理解Scaling

一般來說,和ResNet以及Transformer結(jié)構(gòu)相比,UNet在實際使用中「深度」并不深,不太容易出現(xiàn)其他「深」神經(jīng)網(wǎng)絡結(jié)構(gòu)常見的梯度消失等優(yōu)化問題。

另外,由于UNet結(jié)構(gòu)的特殊性,淺層的特征通過long skip connection與深層的位置相連接,從而進一步避免了梯度消失等問題。

那么反過來想,這樣的結(jié)構(gòu)如果稍不注意,會不會導致梯度過猛、參數(shù)(特征)由于更新導致震蕩的問題?

圖片圖片

通過對擴散模型任務在訓練過程中特征和參數(shù)的可視化,可以發(fā)現(xiàn),確實存在不穩(wěn)定現(xiàn)象。

參數(shù)(特征)的不穩(wěn)定,影響了梯度,接著又反過來影響參數(shù)更新。最終這個過程對性能有較大的不良干擾的風險。因此需要想辦法去控制這種不穩(wěn)定性。

進一步的,對于擴散模型。UNet的輸入是一個帶噪圖像,如果要求模型能從中準確預測出加入的噪聲,這需要模型對輸入有很強的抵御額外擾動的魯棒性。

論文:https://arxiv.org/abs/2310.13545

代碼:https://github.com/sail-sg/ScaleLong

研究人員發(fā)現(xiàn)上述這些問題,可以在Long skip connection上進行Scaling來進行統(tǒng)一地緩解。

從定理3.1來看,中間層特征的震蕩范圍(上下界的寬度)正相關于scaling系數(shù)的平方和。適當?shù)膕caling系數(shù)有助于緩解特征不穩(wěn)定。

不過需要注意的是,如果直接讓scaling系數(shù)設置為0,確實最佳地緩解了震蕩。(手動狗頭)

但是UNet退化為無skip的情況的話,不穩(wěn)定問題是解決了,但是表征能力也沒了。這是模型穩(wěn)定性和表征能力的trade-off。

圖片圖片

類似地,從參數(shù)梯度的角度。定理3.3也揭示了scaling系數(shù)對梯度量級的控制。

圖片圖片

進一步地,定理3.4還揭示了long skip connection上的scaling還可以影響模型對輸入擾動的魯棒上界,提升擴散模型對輸入擾動的穩(wěn)定性。

成為Scaling

通過上述的分析,我們清楚了Long skip connection上進行scaling對穩(wěn)定模型訓練的重要性,圖片也適用于上述的分析。

接下來,我們將分析怎么樣的scaling可以有更好的性能,畢竟上述分析只能說明scaling有好處,但不能確定怎么樣的scaling最好或者較好。

一種簡單的方式是為long skip connection引入可學習的模塊來自適應地調(diào)整scaling,這種方法稱為Learnable Scaling (LS) Method。我們采用類似SENet的結(jié)構(gòu),即如下所示(此處考慮的是代碼整理得非常好的U-ViT結(jié)構(gòu),贊!)

圖片圖片

從本文的結(jié)果來看,LS確實可以有效地穩(wěn)定擴散模型的訓練!進一步地,我們嘗試可視化LS中學習到的系數(shù)。

如下圖所示,我們會發(fā)現(xiàn)這些系數(shù)呈現(xiàn)出一種指數(shù)下降的趨勢(注意這里第一個long skip connection是指連接UNet首尾兩端的connection),且第一個系數(shù)幾乎接近于1,這個現(xiàn)象也很amazing!

圖片圖片

基于這一系列觀察(更多的細節(jié)請查閱論文),我們進一步提出了Constant Scaling (CS) Method,即無需可學習參數(shù)的:

圖片

CS策略和最初的使用圖片的scaling操作一樣無需額外參數(shù),從而幾乎沒有太多的額外計算消耗。

雖然CS在大多數(shù)時候沒有LS在穩(wěn)定訓練上表現(xiàn)好,不過對于已有的圖片策略來說,還是值得一試。

上述CS和LS的實現(xiàn)均非常簡潔,僅僅需要若干行代碼即可。針對各(hua)式(li)各(hu)樣(shao)的UNet結(jié)構(gòu)可能需要對齊一下特征維度。(手動狗頭+1)

最近,一些后續(xù)工作,比如FreeU、SCEdit等工作也揭示了skip connection上scaling的重要性,歡迎大家試用和推廣。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-04-11 07:09:43

大模型人工智能AI

2024-03-28 13:19:05

AI數(shù)據(jù)

2025-02-21 13:20:00

2009-05-19 11:46:21

2023-08-22 13:20:00

模型訓練

2024-01-29 06:40:00

AI模型

2020-11-05 16:21:15

中山大學

2023-03-14 14:06:52

訓練模型

2024-01-12 13:10:06

AI數(shù)據(jù)

2023-10-30 17:23:54

數(shù)據(jù)模型

2021-11-16 15:37:43

AI 數(shù)據(jù)人工智能

2016-12-24 00:08:11

教育信息化

2014-11-13 10:17:30

中山大學新炬網(wǎng)絡學院大數(shù)據(jù)技術

2025-03-17 10:25:28

2025-02-21 09:35:00

3DAI生成

2025-03-17 12:48:50

2016-07-15 09:53:27

太一星晨

2022-11-04 17:02:31

AI模型

2021-02-24 15:38:37

數(shù)據(jù)語言架構(gòu)

2023-11-29 15:00:00

數(shù)據(jù)訓練
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文字幕第一页在线 | 亚洲精品视频三区 | 狠狠色综合久久丁香婷婷 | 精品av久久久久电影 | 人人擦人人 | 97免费视频在线观看 | 亚洲视频免费观看 | 国产日韩精品在线 | 亚洲精品久久久蜜桃 | 国产精品伦一区二区三级视频 | 91九色porny首页最多播放 | 毛片一区二区三区 | 三级成人在线 | 91婷婷韩国欧美一区二区 | 97超在线视频| 成年人在线观看视频 | 色999视频| 搞黄视频免费看 | 亚洲欧美日韩精品久久亚洲区 | 欧美国产精品一区二区 | 日韩第一区 | 国产成人精品免费视频大全最热 | 免费一区二区 | 一区二区三区四区电影视频在线观看 | 日本粉嫩一区二区三区视频 | 欧美日韩在线免费 | 久久久精| 久久免费精品 | 在线免费激情视频 | 欧美一区精品 | 成人深夜小视频 | 欧美舔穴 | 日日干干夜夜 | 国产精品毛片 | 日韩一区中文字幕 | 国产日韩av一区二区 | 国产精品久久国产精品 | 一区二区三区四区不卡视频 | 亚洲国产成人av好男人在线观看 | 福利视频日韩 | 亚洲免费毛片 |