成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

北大團隊用Diffusion升級DragGAN,泛化更強生成質量更高,點一點「大山拔地而起」

人工智能 新聞
DragGAN如今GitHub Star量已經超過3w,它的底層模型基于GAN(生成對抗網絡)。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

北大團隊最新工作,用擴散模型也能實現拖拉拽P圖!

點一點,就能讓雪山長個兒:

圖片

或者讓太陽升起:

圖片

這就是DragonDiffusion,由北京大學張健老師團隊VILLA(Visual-Information Intelligent Learning LAB),依托北京大學深圳研究生院-兔展智能AIGC聯合實驗室,聯合騰訊ARC Lab共同帶來。

它可以被理解為DragGAN的變種。

DragGAN如今GitHub Star量已經超過3w,它的底層模型基于GAN(生成對抗網絡)。

圖片

一直以來,GAN在泛化能力和生成圖像質量上都有短板。

而這剛好是擴散模型(Diffusion Model)的長處。

所以張健老師團隊就將DragGAN范式推廣到了Diffusion模型上。

該成果發布時登上知乎熱榜。

圖片

有人評價說,這解決了Stable Diffusion生成圖片中部分殘缺的問題,可以很好進行控制重繪。

圖片

讓獅子在照片中轉頭

Dragon Diffusion能帶來的效果還包括改變車頭形狀:

圖片

讓沙發逐漸變長:

圖片

再或者是手動瘦臉:

圖片

也能替換照片中的物體,比如把甜甜圈放到另一張圖片里:

圖片

或者是給獅子轉轉頭:

圖片

該方法框架中包括兩個分支,引導分支(guidance branch)和生成分支(generation branch)。

首先,待編輯圖像圖片通過Diffusion的逆過程,找到該圖像在擴散隱空間中的表示,作為兩個分支的輸入。

其中,引導分支會對原圖像進行重建,重建過程中將原圖像中的信息注入下方的生成分支。

生成分支的作用是引導信息對原圖像進行編輯,同時保持主要內容與原圖一致。

根據擴散模型中間特征具有強對應關系,DragonDiffusion在每一個擴散迭補中,將兩個分支的隱變量圖片通過相同的UNet去噪器轉換到特征域。

然后利用兩個mask,圖片圖片區域。標定拖動內容在原圖像和編輯后圖像中的位置,然后約束圖片的內容出現在圖片區域。

論文通過cosin距離來度量兩個區域的相似度,并對相似度進行歸一化:

圖片

除了約束編輯后的內容變化,還應該保持其他未編輯區域與原圖的一致性。這里也同樣通過對應區域的相似度進行約束。最終,總損失函數設計為:

圖片

在編輯信息的注入方面,論文通過score-based Diffusion將有條件的擴散過程視為一個聯合的score function:

圖片

將編輯信號通過基于特征強對應關系的score function轉化為梯度,對擴散過程中的隱變量圖片進行更新。

為了兼顧語義和圖形上的對齊,作者在這個引導策略的基礎上引入了多尺度引導對齊設計。

圖片

此外,為了進一步保證編輯結果和原圖的一致性,DragonDiffusion方法中設計了一種跨分支的自注意力機制。

具體做法是利用引導分支自注意力模塊中的Key和Value替換生成分支自注意力模塊中的Key和Value,以此來實現特征層面的參考信息注入。

最終,論文提出的方法,憑借其高效的設計,為生成的圖像和真實圖像提供了多種編輯模式。

這包括在圖像中移動物體、調整物體大小、替換物體外觀和圖像內容拖動。

圖片

在該方法中,所有的內容編輯和保存信號都來自圖像本身,無需任何微調或訓練附加模塊,這能簡化編輯過程。

研究人員在實驗中發現,神經網絡第一層太淺,無法準確重建圖像。但如果到第四層重建又會太深,效果同樣很差。在第二/三層的效果最佳。

圖片

相較于其他方法,Dragon Diffusion的消除效果也表現更好。

圖片


來自北大張健團隊等

該成果由北京大學張健團隊、騰訊ARC Lab和北京大學深圳研究生院-兔展智能AIGC聯合實驗室共同帶來。

張健老師團隊曾主導開發T2I-Adapter,能夠對擴散模型生成內容進行精準控制。

在GitHub上攬星超2k。

圖片

該技術已被Stable Diffusion官方使用,作為涂鴉生圖工具Stable Doodle的核心控制技術。

圖片

兔展智能聯手北大深研院建立的AIGC聯合實驗室,近期在圖像編輯生成、法律AI產品等多個領域取得突破性技術成果。

就在幾周前,北大-兔展AIGC聯合實驗室就推出了登上知乎熱搜第一的的大語言模型產品ChatLaw,在全網帶來千萬曝光同時,也引發了一輪社會討論。

圖片

聯合實驗室將聚焦以CV為核心的多模態大模型,在語言領域繼續深挖ChatLaw背后的ChatKnowledge大模型,解決法律金融等垂直領域防幻覺,可私有化、數據安全問題。

據悉,實驗室近期還會推出原創對標Stable Diffusion的大模型。

論文地址:https://arxiv.org/abs/2307.02421

項目主頁:https://mc-e.github.io/project/DragonDiffusion/

責任編輯:張燕妮 來源: 量子位
相關推薦

2013-07-09 10:05:24

iCloud數據中心建筑

2019-09-23 17:36:27

數據中心

2011-11-30 09:26:25

項目管理

2010-05-20 15:29:43

優化IIS

2016-04-05 10:12:58

HiveSQLHadoop

2025-04-25 09:15:00

模型數據AI

2013-01-08 10:06:43

創業創業方法

2012-03-27 08:49:19

Json

2009-09-14 19:44:27

LINQ To SQL

2009-07-09 15:09:05

JDK卸載

2025-05-29 00:00:00

UI 庫前端模塊化

2011-03-15 10:41:05

內部類

2009-12-15 14:27:30

Ruby存取器

2024-11-13 14:25:00

模型架構

2017-01-03 10:42:54

零售 企業

2012-03-13 15:04:47

UCS

2011-10-27 16:11:46

后PC時代

2024-11-25 10:12:00

AI數據

2009-09-03 14:28:23

C#日期格式化

2011-06-03 14:00:09

SEODIV+CSSWEB
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文字幕在线视频精品 | www亚洲免费国内精品 | 欧美中文字幕在线观看 | 亚洲高清久久 | 我要看免费一级毛片 | 国产乱码精品一区二区三区忘忧草 | 日韩精品1区2区3区 成人黄页在线观看 | h视频免费在线观看 | 亚洲精品国产成人 | 在线日韩av电影 | 一区二区三区四区视频 | 久久毛片| www.久久.com | 伊人久久大香线 | 男人天堂网av | 午夜精品久久久久久久久久久久久 | 日本一道本视频 | 日日摸夜夜添夜夜添特色大片 | 三级在线观看 | 久草中文网 | 久久久久亚洲精品 | 午夜免费在线电影 | 成人免费观看男女羞羞视频 | 欧日韩不卡在线视频 | 成人免费视频网站在线观看 | 91欧美激情一区二区三区成人 | 国产成人精品久久二区二区91 | 极品一区 | 精品国产一区二区久久 | 久久久2o19精品 | 国产精品五区 | 精品国模一区二区三区欧美 | 亚洲午夜精品一区二区三区他趣 | 亚洲精品在线免费观看视频 | 国产一区二区av | 久久久久久九九九九 | 喷水毛片 | 91国内外精品自在线播放 | 黄色大片在线 | 成年免费大片黄在线观看岛国 | 日韩精品视频网 |