成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

多模態圖像合成與編輯這么火,馬普所、南洋理工等出了份詳細綜述

人工智能 新聞
本篇綜述通過對現有的多模態圖像合成與編輯方法的歸納總結,對該領域目前的挑戰和未來方向進行了探討和分析。

近期 OpenAI 發布的 DALLE-2 和谷歌發布的 Imagen 等實現了令人驚嘆的文字到圖像的生成效果,引發了廣泛關注并且衍生出了很多有趣的應用。而文字到圖像的生成屬于多模態圖像合成與編輯領域的一個典型任務。近日,來自馬普所和南洋理工等機構的研究人員對多模態圖像合成與編輯這一大領域的研究現狀和未來發展做了詳細的調查和分析。

圖片


  • 論文地址:https://arxiv.org/pdf/2112.13592.pdf
  • 項目地址:https://github.com/fnzhan/MISE


圖片

在第一章節,該綜述描述了多模態圖像合成與編輯任務的意義和整體發展,以及本論文的貢獻與總體結構。

在第二章節,根據引導圖片合成與編輯的數據模態,該綜述論文介紹了比較常用的視覺引導(比如 語義圖,關鍵點圖,邊緣圖),文字引導,語音引導,場景圖(scene graph)引導和相應模態數據的處理方法以及統一的表示框架。

在第三章節,根據圖像合成與編輯的模型框架,該論文對目前的各種方法進行了分類,包括基于 GAN 的方法,自回歸方法,擴散模型方法,和神經輻射場(NeRF)方法。

圖片

圖片

由于基于 GAN 的方法一般使用條件 GAN 和 無條件 GAN 反演,因此該論文將這一類別進一步分為模態內條件(例如語義圖,邊緣圖),跨模態條件(例如文字和語音),和 GAN 反演(統一模態)并進行了詳細描述。

圖片

相比于基于 GAN 的方法,自回歸模型方法能夠更加自然的處理多模態數據,以及利用目前流行的 Transformer 模型。自回歸方法一般先學習一個向量量化編碼器將圖片離散地表示為 token 序列,然后自回歸式地建模 token 的分布。由于文本和語音等數據都能表示為 token 并作為自回歸建模的條件,因此各種多模態圖片合成與編輯任務都能統一到一個框架當中。

圖片


圖片

近期,火熱的擴散模型也被廣泛應用于多模態合成與編輯任務。例如效果驚人的 DALLE-2 和 Imagen 都是基于擴散模型實現的。相比于 GAN,擴散式生成模型擁有一些良好的性質,比如靜態的訓練目標和易擴展性。該論文依據條件擴散模型和預訓練擴散模型對現有方法進行了分類與詳細分析。

圖片


圖片

以上方法主要聚焦于 2D 圖像的多模態合成與編輯。近期隨著神經輻射場(NeRF)的迅速發展,3D 感知的多模態合成與編輯也吸引了越來越多的關注。由于需要考慮多視角一致性,3D 感知的多模態合成與編輯是更具挑戰性的任務。本文針對單場景優化 NeRF,生成式 NeRF 和 NeRF 反演的三種方法對現有工作進行了分類與總結。

隨后,該綜述對以上四種模型方法的進行了比較和討論。總體而言,相比于 GAN,目前最先進的模型更加偏愛自回歸模型和擴散模型。而 NeRF 在多模態合成與編輯任務的應用為這個領域的研究打開了一扇新的窗戶。

圖片


在第四章節,該綜述匯集了多模態合成與編輯領域流行的數據集以及相應的模態標注,并且針對各模態典型任務(語義圖像合成,文字到圖像合成,語音引導圖像編輯)對當前方法進行了定量的比較。

在第五章節,該綜述對此領域目前的挑戰和未來方向進行了探討和分析,包括大規模的多模態數據集,準確可靠的評估指標,高效的網絡架構,以及 3D 感知的發展方向。

在第六和第七章節,該綜述分別闡述了此領域潛在的社會影響和總結了文章的內容與貢獻。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-06-28 18:18:22

2024-07-01 10:19:22

2023-09-11 12:04:20

2024-04-08 00:12:19

2023-04-13 15:25:14

模型

2024-03-11 09:37:01

模型圖片編輯

2024-07-15 08:58:00

2025-03-17 12:48:50

2023-04-10 16:34:46

模型文本

2023-05-19 13:24:20

模型AI

2021-04-06 10:20:42

機器學習人工智能計算機

2015-07-22 12:56:38

愛奇藝

2025-04-28 14:13:43

開源SOTA多模態

2025-05-21 09:14:38

2023-12-03 08:46:20

模型開源

2025-01-16 11:00:00

圖像模型AI

2025-02-12 10:12:00

視頻模型AI

2025-03-17 10:25:28

2013-03-04 10:10:36

WebKit瀏覽器

2022-02-25 10:56:08

自動駕駛傳感器技術
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 一区二区三区视频在线免费观看 | 国产福利二区 | 欧美天堂 | 992人人草 | av免费在线观看网站 | 99精品欧美一区二区三区综合在线 | 久久大陆 | 国产精品一区二区在线 | 国产一区二区免费 | 天堂中文资源在线 | 欧美亚洲在线 | 久久久精品国产 | 国产精品久久久久久久久久99 | 亚洲国产成人精品女人 | 国产精品一区2区 | www.日韩高清| 中文字幕 国产 | 中文字幕亚洲欧美日韩在线不卡 | 综合精品久久久 | 香蕉视频久久久 | 99免费在线观看视频 | 欧美一级二级视频 | 91成人在线 | 国产激情91久久精品导航 | 国产视频精品在线观看 | 精品日韩一区二区 | 国产在线观看一区二区三区 | 久久99精品久久久久久 | 成人久久网| 高清欧美性猛交xxxx黑人猛交 | 日韩高清中文字幕 | 亚洲精品一区在线 | 美女黄网 | 操操操日日日 | 日日摸日日添日日躁av | 国产精品123区 | 99久久久久国产精品免费 | 日韩免 | 九九热精品视频在线观看 | 粉嫩一区二区三区四区公司1 | 一级免费a|