成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

只需1%參數,效果超越ControlNet,新AI繪畫控制大師來襲

人工智能 新聞
研究人員在評估了不同大小的控制模型后發現,控制模型甚至不必和2.6B參數的StableDiffusion-XL基礎網絡大小一樣。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

“新·AI繪畫細節控制大師”ControlNet-XS來啦!

敲重點的是參數只要原始ControlNet的1%

就能做到蛋糕口味隨意切換:

圖片

△左圖為改前

改變一個人的行頭也輕輕松松:

圖片

上圖同款,身形不變藝術氛圍感拉滿:

圖片

自然風光也能hou住,一年四季任意切換:

圖片

還有這貓頭鷹,直接從活物變雕塑:

圖片

參數很小的情況下,能做到這樣的效果,網友也是直呼絕絕子,并迫不及待想看論文。

圖片

ControlNet-XS由海德堡大學計算機視覺實驗室研發,目前相關論文、預訓練模型還未公布。

但研究人員表示ControlNet-XSFID分數明顯優于ControlNet

且控制Stable Diffusion-XL和Stable Diffusion 2.1的代碼將在不久后開源。

圖片

新生代控制大師

圖片

先來康康對StableDiffusion-XL的控制。

研究人員在評估了不同大小的控制模型后發現,控制模型甚至不必和2.6B參數的StableDiffusion-XL基礎網絡大小一樣。

400M、104M和48M參數的ControlNet-XS控制也很明顯。

深度圖給出了更為直觀的展示,根據圖像內容的距離、深度,深度圖呈現出準確的顏色深淺度:

圖片

要注意的是,這里研究人員設置的每行seed值不同,每列seed值相同。

此外,還有Canny邊緣檢測圖,物體的邊界、輪廓都能清晰地展現出來:

圖片

對StableDiffusion的控制,研究人員則是評估了491M、55M和14M參數的三個版本的ControlNet-XS。

結果表明1.6%的參數(865M)也能夠可靠地控制生成過程。

圖片

那這是如何做到的呢?

從頭開始訓練

原始ControlNet是StableDiffusion基礎模型(base model)中U-Net編碼器的副本,所以接收與基礎模型相同的輸入,并帶有額外的引導信號,比如說邊緣圖。

然后,經過訓練的ControlNet的中間輸出被添加到基礎模型的解碼器層的輸入中。在ControlNet的整個訓練過程中,基礎模型的權重保持凍結狀態。

ControlNet-XS的研究者們認為這種方法存在問題,ControlNet不必這么龐大。

首先是Stable Diffusion最終輸出圖像,是在一系列步驟中迭代生成的。每個步驟會在U-Net網絡結構的編碼器(Encoder)和解碼器(Decoder)兩部分中執行。

每次迭代基礎模型和控制模型的輸入是前一個步驟生成的圖像。控制模型還接收一個控制圖像。

問題在于,在編碼器階段這兩個模型都獨立運行,而控制模型的反饋只在基礎模型的解碼階段輸入。

總之,結果就是一個延遲的校正/控制機制

也就是說ControlNet必須執行兩項任務:一邊校正/控制,一邊還要提前預測基本模型的編碼器將犯哪些“錯誤”。

通過暗示圖像生成和控制需要相似的模型容量,自然而然地可以用基礎模型的權重初始化ControlNet的權重,然后進行微調。

圖片

而對于ControlNet-XS,研究人員表示從設計上就與基礎模型不同,是從零開始訓練ControlNet-XS權重,解決了延遲反饋的問題。

如上圖所示,方法是從基礎模型的編碼器添加連接到控制編碼器(A),這樣校正過程可以更快地適應基礎模型的生成過程。但這并不能完全消除延遲,因為基礎模型的編碼器仍然沒有受到引導。

因此,研究人員從ControlNet-XS添加額外的連接到基礎模型編碼器,直接影響整個生成過程(B)。

此外,他們還評估了在ControlNet設置中使用鏡像解碼架構是否有用(C)。

最終,研究人員在COCO2017驗證集上,針對Canny邊緣引導的三種不同變體(A、B、C)與原始的ControlNet進行了FID分數性能評估。

結果所有變體都有了顯著提升,同時僅使用了原始ControlNet參數的一小部分。

圖片

研究人員又拿出了變體B,分別使用Canny邊緣圖和深度圖引導,針對StableDiffusion2.1和StableDiffusion-XL分別訓練了三種不同大小的模型。

圖片

所以下一步就等相關論文、代碼以及預訓練模型公布啦~

圖片

項目地址:https://vislearn.github.io/ControlNet-XS/

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-02-22 17:38:17

AI

2023-03-02 14:00:03

AI繪畫

2024-12-30 08:50:00

AI數據訓練

2024-03-01 12:33:14

模型訓練

2024-11-04 08:47:00

2021-04-22 10:13:34

鴻蒙HarmonyOS應用

2023-03-17 16:44:16

AI繪畫

2023-05-06 08:23:36

ChatGPT自然語言技術

2024-11-12 14:00:00

AI編程

2017-08-17 11:56:24

天貓

2014-10-21 14:46:26

2013-03-11 13:48:24

投影

2023-02-28 23:16:38

AI視頻技術

2023-02-27 13:57:43

ChatGPTAI繪畫

2023-09-21 10:38:00

繪畫AI

2025-07-02 08:50:00

AI智能體模型

2025-06-23 08:56:00

2022-08-08 09:47:09

AI算法模型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产成人久久久 | 男人的天堂在线视频 | 久久久久久99| 国产精品一区在线 | 99爱免费 | 日韩在线不卡 | 在线视频国产一区 | 毛片电影 | 一区二区三区国产 | 久久国产精品偷 | 日本黄色短片 | 国产精品国产精品国产专区不卡 | 国外成人在线视频 | 国产精品久久国产精品 | 国产情侣久久 | 亚洲国产精品久久 | 高清视频一区二区三区 | 99久久99| 伊人春色成人 | 国产精品久久网 | 久久久一区二区三区 | 在线久草| 欧美精品在线一区二区三区 | 久久久久久久久国产精品 | 欧美中文在线 | 国产丝袜一区二区三区免费视频 | 亚洲午夜视频在线观看 | 欧美国产激情二区三区 | 久久网国产 | 一区二区三区韩国 | 狠狠躁18三区二区一区 | 精品一区av | 成人在线精品 | 国产精品一区二区视频 | 国户精品久久久久久久久久久不卡 | 91色啪| 亚洲一区二区视频 | 精品国产一区二区三区日日嗨 | 久久成人一区二区三区 | 美女中文字幕视频 | 毛片网站免费观看 |