成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

解決文生圖質(zhì)量和美學(xué)問題,字節(jié)跳動提出VMix:多維度美學(xué)控制方法,一鍵提升圖像美學(xué)

人工智能 新聞
論文基于提出的方法訓(xùn)練了一個即插即用的模塊,無需再訓(xùn)練即可應(yīng)用于不同的開源模型,提升模型的生成美感。

本文經(jīng)AIGC Studio公眾號授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

為了解決擴散模型在文生圖的質(zhì)量和美學(xué)問題,字節(jié)跳動&中科大研究團隊提出VMix美學(xué)條件注入方法,通過將抽象的圖像美感拆分成不同維度的美學(xué)向量引入擴散模型,從而實現(xiàn)細粒度美學(xué)圖像生成。論文基于提出的方法訓(xùn)練了一個即插即用的模塊,無需再訓(xùn)練即可應(yīng)用于不同的開源模型,提升模型的生成美感。

圖片

相關(guān)鏈接 

  • 文章:https://arxiv.org/pdf/2412.20800
  • 代碼:https://github.com/fenfenfenfan/VMix
  • 項目:https://vmix-diffusion.github.io/VMix/

論文介紹 

圖片

雖然擴散模型在文本到圖像生成方面表現(xiàn)出色,但它們?nèi)钥赡軣o法生成高度美觀的圖像。更具體地說,在顏色、光照、構(gòu)圖等更細粒度的維度上,生成的圖像與現(xiàn)實世界的美學(xué)圖像之間仍然存在差距。

在本文中,我們提出了跨注意值混合控制(VMix)適配器,這是一種即插即用的美學(xué)適配器,通過(1)通過初始化美學(xué)嵌入將輸入文本提示解開為內(nèi)容描述和美學(xué)描述,以及(2)通過值混合交叉注意將美學(xué)條件整合到去噪過程中,網(wǎng)絡(luò)通過零初始化的線性層連接,來升級生成圖像的質(zhì)量,同時保持跨視覺概念的通用性。我們的關(guān)鍵見解是通過設(shè)計一種優(yōu)越的條件控制方法來增強現(xiàn)有擴散模型的美學(xué)呈現(xiàn),同時保持圖像-文本對齊。

通過我們精心的設(shè)計,VMix 足夠靈活,可以應(yīng)用于社區(qū)模型以獲得更好的視覺性能而無需重新訓(xùn)練。為了驗證我們方法的有效性,我們進行了大量實驗,結(jié)果表明 VMix 優(yōu)于其他最先進的方法,并且與其他社區(qū)模塊(例如 LoRA、ControlNet 和 IPAdapter)兼容以用于圖像生成。

圖片現(xiàn)有的方法總是無法滿足人類對視覺生成內(nèi)容的細粒度偏好。人類喜愛的圖像應(yīng)該同時在各種細粒度的美學(xué)維度上表現(xiàn)出色,例如自然光、連貫的色彩和合理的構(gòu)圖。為了應(yīng)對這一挑戰(zhàn),我們推出了VMix,這是一種新穎的即插即用適配器,旨在系統(tǒng)地彌合生成的圖像與現(xiàn)實世界圖像在各種美學(xué)維度上的美學(xué)質(zhì)量差距。

它是如何工作的? 

圖片VMix 示意圖:

(a)在初始化階段,通過 CLIP 將預(yù)定義的美學(xué)標簽轉(zhuǎn)化為 [CLS] token,從而得到 AesEmb,只需要在訓(xùn)練開始時處理一次。

(b)在訓(xùn)練階段,項目層首先將輸入的美學(xué)描述 y aes映射到與內(nèi)容文本嵌入 f t具有相同 token 維度的 嵌入 f a 。然后通過值混合交叉注意力將文本嵌入 f t集成到去噪網(wǎng)絡(luò)中。

(c) 在推理階段,VMix 從 AesEmb 中提取所有正向美學(xué)嵌入以形成美學(xué)輸入,并與內(nèi)容輸入一起輸入到模型中進行去噪過程。

美學(xué)細膩控制 

VMix 可以通過調(diào)整美學(xué)嵌入來實現(xiàn)細粒度的美學(xué)控制。當僅使用單維美學(xué)標簽時,可以觀察到圖像質(zhì)量在特定維度上得到改善。當使用全正美學(xué)標簽時,圖像的視覺性能整體優(yōu)于基線。

圖片

Prompt: "A girl leaning against a window with a breeze blowing, summer portrait, half-length medium view"

與當前方法的比較 

與各種最先進的方法進行定性比較。所有結(jié)果均基于穩(wěn)定擴散。

圖片與各種最先進的方法進行定性比較。所有方法的結(jié)果均基于 SDXL。

圖片

個性化文本轉(zhuǎn)圖像模型

帶有或不帶有 VMix 的個性化模型生成的圖像。

圖片

責任編輯:張燕妮 來源: AIGC Studio
相關(guān)推薦

2014-07-18 09:42:37

應(yīng)用開發(fā)開發(fā)美學(xué)

2016-12-02 17:37:51

快手

2014-07-30 14:52:32

應(yīng)用App產(chǎn)品

2015-10-13 15:24:46

2011-04-28 13:13:40

筆記本MacBook

2011-10-06 15:14:38

筆記本評測

2022-12-28 14:21:43

2016-09-22 16:12:32

華碩筆記本新品

2009-10-29 08:43:00

Windows 7系統(tǒng)升級

2017-07-07 10:20:39

互聯(lián)網(wǎng)

2018-10-24 10:46:51

黑鯊

2020-12-21 20:46:07

奢侈品人工智能AR

2025-02-11 09:00:00

2014-08-13 13:52:21

百加手機體驗

2018-11-02 13:03:06

物聯(lián)網(wǎng)設(shè)備物聯(lián)網(wǎng)IOT

2017-09-18 11:07:24

昭陽K42
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 很黄很污的网站 | 天天草天天操 | 欧美日韩成人在线 | 亚洲一区二区在线播放 | 在线观看成人免费视频 | 天堂av资源 | 精品91视频 | 日韩一级电影免费观看 | 午夜小视频在线观看 | 亚洲精品久久久久久国产精华液 | 亚洲精品视频一区二区三区 | 亚洲一一在线 | 亚洲a视频| 懂色av色香蕉一区二区蜜桃 | 国产不卡在线播放 | 欧美成年黄网站色视频 | 国产一二区免费视频 | 亚洲一区二区在线 | 日本三级网站在线观看 | 国产精品黄视频 | 免费成人高清在线视频 | 麻豆av在线 | 欧美一级在线 | www.av在线 | 国产精品久久久久久久7电影 | 午夜久久久久 | 日韩精品在线播放 | 成人福利电影 | 色就是色欧美 | 久久99久久99久久 | 国产美女自拍视频 | 久久日韩粉嫩一区二区三区 | 亚洲国产精品一区二区三区 | 国产在线播 | 欧洲高清转码区一二区 | 欧美一区二区三区在线视频 | 亚洲人成人一区二区在线观看 | 亚洲成人av一区二区 | 欧美福利专区 | 久久精品久久综合 | 99re热精品视频国产免费 |