成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<form id="jtgdn"></form><th id="jtgdn"></th>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

北大團隊用Diffusion升級DragGAN，泛化更強生成質量更高，點一點「大山拔地而起」

作者：明敏 2023-08-02 12:50:53

人工智能新聞

DragGAN如今GitHub Star量已經超過3w，它的底層模型基于GAN（生成對抗網絡）。

本文經AI新媒體量子位（公眾號ID:QbitAI）授權轉載，轉載請聯系出處。

北大團隊最新工作，用擴散模型也能實現拖拉拽P圖！

點一點，就能讓雪山長個兒：

或者讓太陽升起：

這就是DragonDiffusion，由北京大學張健老師團隊VILLA（Visual-Information Intelligent Learning LAB），依托北京大學深圳研究生院-兔展智能AIGC聯合實驗室，聯合騰訊ARC Lab共同帶來。

它可以被理解為DragGAN的變種。

DragGAN如今GitHub Star量已經超過3w，它的底層模型基于GAN（生成對抗網絡）。

一直以來，GAN在泛化能力和生成圖像質量上都有短板。

而這剛好是擴散模型（Diffusion Model）的長處。

所以張健老師團隊就將DragGAN范式推廣到了Diffusion模型上。

該成果發布時登上知乎熱榜。

有人評價說，這解決了Stable Diffusion生成圖片中部分殘缺的問題，可以很好進行控制重繪。

讓獅子在照片中轉頭

Dragon Diffusion能帶來的效果還包括改變車頭形狀：

讓沙發逐漸變長：

再或者是手動瘦臉：

也能替換照片中的物體，比如把甜甜圈放到另一張圖片里：

或者是給獅子轉轉頭：

該方法框架中包括兩個分支，引導分支（guidance branch）和生成分支（generation branch）。

首先，待編輯圖像通過Diffusion的逆過程，找到該圖像在擴散隱空間中的表示，作為兩個分支的輸入。

其中，引導分支會對原圖像進行重建，重建過程中將原圖像中的信息注入下方的生成分支。

生成分支的作用是引導信息對原圖像進行編輯，同時保持主要內容與原圖一致。

根據擴散模型中間特征具有強對應關系，DragonDiffusion在每一個擴散迭補中，將兩個分支的隱變量通過相同的UNet去噪器轉換到特征域。

然后利用兩個mask，和區域。標定拖動內容在原圖像和編輯后圖像中的位置，然后約束的內容出現在區域。

論文通過cosin距離來度量兩個區域的相似度，并對相似度進行歸一化：

除了約束編輯后的內容變化，還應該保持其他未編輯區域與原圖的一致性。這里也同樣通過對應區域的相似度進行約束。最終，總損失函數設計為：

在編輯信息的注入方面，論文通過score-based Diffusion將有條件的擴散過程視為一個聯合的score function：

將編輯信號通過基于特征強對應關系的score function轉化為梯度，對擴散過程中的隱變量進行更新。

為了兼顧語義和圖形上的對齊，作者在這個引導策略的基礎上引入了多尺度引導對齊設計。

此外，為了進一步保證編輯結果和原圖的一致性，DragonDiffusion方法中設計了一種跨分支的自注意力機制。

具體做法是利用引導分支自注意力模塊中的Key和Value替換生成分支自注意力模塊中的Key和Value，以此來實現特征層面的參考信息注入。

最終，論文提出的方法，憑借其高效的設計，為生成的圖像和真實圖像提供了多種編輯模式。

這包括在圖像中移動物體、調整物體大小、替換物體外觀和圖像內容拖動。

在該方法中，所有的內容編輯和保存信號都來自圖像本身，無需任何微調或訓練附加模塊，這能簡化編輯過程。

研究人員在實驗中發現，神經網絡第一層太淺，無法準確重建圖像。但如果到第四層重建又會太深，效果同樣很差。在第二/三層的效果最佳。

相較于其他方法，Dragon Diffusion的消除效果也表現更好。

來自北大張健團隊等

該成果由北京大學張健團隊、騰訊ARC Lab和北京大學深圳研究生院-兔展智能AIGC聯合實驗室共同帶來。

張健老師團隊曾主導開發T2I-Adapter，能夠對擴散模型生成內容進行精準控制。

在GitHub上攬星超2k。

該技術已被Stable Diffusion官方使用，作為涂鴉生圖工具Stable Doodle的核心控制技術。

兔展智能聯手北大深研院建立的AIGC聯合實驗室，近期在圖像編輯生成、法律AI產品等多個領域取得突破性技術成果。

就在幾周前，北大-兔展AIGC聯合實驗室就推出了登上知乎熱搜第一的的大語言模型產品ChatLaw，在全網帶來千萬曝光同時，也引發了一輪社會討論。

聯合實驗室將聚焦以CV為核心的多模態大模型，在語言領域繼續深挖ChatLaw背后的ChatKnowledge大模型，解決法律金融等垂直領域防幻覺，可私有化、數據安全問題。

據悉，實驗室近期還會推出原創對標Stable Diffusion的大模型。

論文地址：https://arxiv.org/abs/2307.02421

項目主頁：https://mc-e.github.io/project/DragonDiffusion/

責任編輯：張燕妮來源：量子位

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：中文字幕在线视频精品 | www亚洲免费国内精品 | 欧美中文字幕在线观看 | 亚洲高清久久 | 我要看免费一级毛片 | 国产乱码精品一区二区三区忘忧草 | 日韩精品1区2区3区成人黄页在线观看 | h视频免费在线观看 | 亚洲精品国产成人 | 在线日韩av电影 | 一区二区三区四区视频 | 久久毛片| www.久久.com | 伊人久久大香线 | 男人天堂网av | 午夜精品久久久久久久久久久久久 | 日本一道本视频 | 日日摸夜夜添夜夜添特色大片 | 三级在线观看 | 久草中文网 | 久久久久亚洲精品 | 午夜免费在线电影 | 成人免费观看男女羞羞视频 | 欧日韩不卡在线视频 | 成人免费视频网站在线观看 | 91欧美激情一区二区三区成人 | 国产成人精品久久二区二区91 | 极品一区 | 精品国产一区二区久久 | 久久久2o19精品 | 国产精品五区 | 精品国模一区二区三区欧美 | 亚洲午夜精品一区二区三区他趣 | 亚洲精品在线免费观看视频 | 国产一区二区av | 久久久久久九九九九 | 喷水毛片 | 91国内外精品自在线播放 | 黄色大片在线 | 成年免费大片黄在线观看岛国 | 日韩精品视频网 |