成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

單圖就能解鎖全景視角!北大/港中文/騰訊等推出ViewCrafter | 已開源

人工智能 新聞
來自ViewCrafter,由北大、港中文、騰訊等機(jī)構(gòu)的研究人員提出,可以從單張或稀疏輸入圖像生成精確相機(jī)可控的新視角視頻。

隨便給張圖就能從更多視角查看全景了?!

話不多說,先看一波效果,單視角輸入be like:

圖片

圖片

難度升級(jí),接下來換成雙視角,看起來銜接也非常絲滑。

圖片

圖片

以上來自ViewCrafter,由北大、港中文、騰訊等機(jī)構(gòu)的研究人員提出,可以從單張或稀疏輸入圖像生成精確相機(jī)可控的新視角視頻。

圖片

還支持場(chǎng)景級(jí)文生3D圖生3D、以及稀疏視角重建等應(yīng)用。

圖片

圖片

目前論文和代碼均已開源,并提供了在線Huggingface demo供用戶使用。

ViewCrafter:一種新視角生成方法

傳統(tǒng)的新視角生成方法,如NeRF和3D-GS等技術(shù),存在一個(gè)痛點(diǎn)

依賴于密集的多視角訓(xùn)練數(shù)據(jù)

這限制了它們?cè)趦H有稀疏(輸入圖像數(shù)量有限,不能提供完整視角或詳盡場(chǎng)景信息)甚至單張輸入視角的情況下的應(yīng)用。

同時(shí),傳統(tǒng)方法對(duì)訓(xùn)練資源的需求較高,且不具備泛化能力,這限制了它們?cè)?strong>訓(xùn)練資源受限場(chǎng)景下的應(yīng)用。

因此,ViewCrafter最終想實(shí)現(xiàn):

從稀疏視角圖像甚至單張輸入圖像中生成任意規(guī)模場(chǎng)景的新視角。

這需要模型對(duì)3D物理世界有全面的理解。

接下來一起康康具體咋實(shí)現(xiàn)的。

概括而言,ViewCrafter是基于點(diǎn)云先驗(yàn)的可控視角視頻生成。

首先,快速多視圖/單視圖stereo技術(shù)的發(fā)展,使得從單張或稀疏圖像中快速重建點(diǎn)云表征成為可能。

點(diǎn)云表征能夠提供3D場(chǎng)景的粗略信息,支持精確的相機(jī)位置控制以實(shí)現(xiàn)自由視角渲染。

然而,由于點(diǎn)云的表示能力較弱,加之極其稀疏的輸入圖像只能提供有限的3D線索,重建出的點(diǎn)云存在大面積的遮擋和缺失區(qū)域,并可能面臨幾何形變和點(diǎn)云噪聲。

這些問題限制了其在新視角合成上的應(yīng)用。

與此同時(shí),在大規(guī)模視頻數(shù)據(jù)集上訓(xùn)練的視頻擴(kuò)散模型能夠深入理解3D物理世界,支持從單張圖像或文本提示中生成符合物理規(guī)律和現(xiàn)實(shí)世界規(guī)則的視頻內(nèi)容。

然而,現(xiàn)有的視頻擴(kuò)散模型缺乏顯式的場(chǎng)景3D信息,因此在視頻生成過程中難以實(shí)現(xiàn)精確的相機(jī)視角控制。

針對(duì)這些優(yōu)缺點(diǎn),團(tuán)隊(duì)提出將視頻擴(kuò)散模型的生成能力與點(diǎn)云表征提供的顯式3D先驗(yàn)相結(jié)合,以實(shí)現(xiàn)相機(jī)精準(zhǔn)可控的任意場(chǎng)景高保真度新視角視頻生成。

圖片

具體而言,給定單張或稀疏視角輸入圖像,團(tuán)隊(duì)首先使用快速多視圖stereo方法構(gòu)建其點(diǎn)云表征,以實(shí)現(xiàn)精準(zhǔn)地移動(dòng)相機(jī)進(jìn)行自由視角渲染。

隨后,為了解決點(diǎn)云渲染結(jié)果中存在的大面積缺失區(qū)域、幾何失真和點(diǎn)云偽影,團(tuán)隊(duì)訓(xùn)練了一個(gè)以點(diǎn)云渲染結(jié)果為控制信號(hào)的視頻擴(kuò)散模型作為增強(qiáng)渲染器

這一渲染器能在粗糙的點(diǎn)云渲染結(jié)果的基礎(chǔ)上進(jìn)一步生成具有高保真度和3D一致性的新視角。

通過結(jié)合點(diǎn)云提供的顯式3D信息以及視頻擴(kuò)散模型的強(qiáng)大生成能力,新方法能夠在視頻生成過程中實(shí)現(xiàn)6自由度的精準(zhǔn)相機(jī)位姿控制,并生成高保真度、一致性強(qiáng)的新視角視頻。

圖片△相機(jī)軌跡規(guī)劃算法

此外,現(xiàn)有的視頻擴(kuò)散模型難以生成長視頻,因?yàn)殚L視頻推理會(huì)造成巨大的計(jì)算開銷。

為了解決這一問題,研究采用了一種迭代式的新視角生成策略,并提出了一種內(nèi)容自適應(yīng)的像機(jī)軌跡規(guī)劃算法,以逐步擴(kuò)展新視角覆蓋的區(qū)域和重建的點(diǎn)云。

具體來說,從初始輸入圖像構(gòu)建的點(diǎn)云開始,團(tuán)隊(duì)首先利用相機(jī)軌跡規(guī)劃算法,從當(dāng)前點(diǎn)云預(yù)測(cè)一段相機(jī)軌跡,以有效揭示遮擋和確實(shí)區(qū)域。

接著,團(tuán)隊(duì)根據(jù)預(yù)測(cè)的軌跡渲染點(diǎn)云,并利用ViewCrafter根據(jù)渲染的點(diǎn)云生成高質(zhì)量的新視角。

隨后利用生成的新視角更新點(diǎn)云,以擴(kuò)展全局點(diǎn)云表征。

通過迭代執(zhí)行這些步驟,最終可以獲得覆蓋大視場(chǎng)范圍和擴(kuò)展點(diǎn)云的高保真新視圖,并支持高斯重建等下游任務(wù)。

具體應(yīng)用上,基于ViewCrafter和提出的迭代式新視角生成算法,可以從單張圖像/稀疏視角甚至一段文字描述中進(jìn)行3D高斯重建,以支持實(shí)時(shí)渲染和沉浸式3D體驗(yàn)。

圖片

對(duì)比實(shí)驗(yàn)

團(tuán)隊(duì)從多個(gè)角度對(duì)比了新方法。

新視角生成來看,團(tuán)隊(duì)在Tanks-and-Temples,CO3D, RealEstate10K這三個(gè)真實(shí)世界數(shù)據(jù)集上與SOTA方法進(jìn)行了定量和定性比較。

實(shí)驗(yàn)結(jié)果證明,ViewCrafter在相機(jī)位姿控制的精準(zhǔn)程度,以及生成新視角的視覺質(zhì)量上都優(yōu)于對(duì)比方法

圖片
圖片

場(chǎng)景重建方面,團(tuán)隊(duì)在Tanks-and-Temples數(shù)據(jù)集上與稀疏視角重建領(lǐng)域的SOTA方法進(jìn)行了定量和定性比較。

結(jié)果證明,ViewCrafter在3D高斯重建渲染出的新視角的視覺質(zhì)量上也超過了對(duì)比方法。

圖片
圖片

文生3D結(jié)果如下。左邊顯示了文本提示以及文生圖效果,后面是最終的3D效果。

圖片

當(dāng)然,團(tuán)隊(duì)也進(jìn)行了消融實(shí)驗(yàn)

比如利用點(diǎn)云先驗(yàn)作為視頻擴(kuò)散模型控制信號(hào)的有效性。

具體而言,一些同期工作采用普呂克坐標(biāo)作為視頻生成模型的控制信號(hào),以實(shí)現(xiàn)相機(jī)可控的新視角生成。

作為對(duì)比,為了驗(yàn)證點(diǎn)云控制信號(hào)的優(yōu)越性,團(tuán)隊(duì)訓(xùn)練了一個(gè)以普呂克坐標(biāo)為控制信號(hào)的新視角生成模型,并進(jìn)行控制變量實(shí)驗(yàn),保證除了控制信號(hào)外其他模型結(jié)構(gòu)與ViewCrafter一致。

兩個(gè)模型在新視角生成任務(wù)上對(duì)比結(jié)果如下所示:

圖片
圖片
圖片

實(shí)驗(yàn)結(jié)果證明,不管是在新視角生成質(zhì)量還是在相機(jī)控制的精準(zhǔn)程度上,團(tuán)隊(duì)使用的基于點(diǎn)云的控制信號(hào)都要優(yōu)于基于普呂克坐標(biāo)的控制信號(hào)

另外,團(tuán)隊(duì)驗(yàn)證了模型對(duì)粗糙點(diǎn)云的魯棒性

如圖所示,對(duì)于作為控制信號(hào)的點(diǎn)云具有嚴(yán)重幾何形變的情況,模型依然能夠有效地進(jìn)行幾何糾錯(cuò)和空洞修補(bǔ)。

這證明了新方法對(duì)點(diǎn)云控制信號(hào)的魯棒性。

圖片

概括下來,團(tuán)隊(duì)驗(yàn)證了ViewCrafter對(duì)于靜態(tài)場(chǎng)景的強(qiáng)大新視角生成能力。

接下來,團(tuán)隊(duì)計(jì)劃探索和單目視頻深度估計(jì)方法結(jié)合,實(shí)現(xiàn)單目動(dòng)態(tài)視頻的新視角生成和4D重建。

更多細(xì)節(jié)歡迎查閱原論文。

GitHub:https://github.com/Drexubery/ViewCrafter
項(xiàng)目主頁:https://drexubery.github.io/ViewCrafter/
論文:https://arxiv.org/abs/2409.02048
Huggingface Demo:https://huggingface.co/spaces/Doubiiu/ViewCrafter

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2024-09-30 09:35:55

圖像生成AI

2024-07-03 12:05:06

Llama模型架構(gòu)

2025-05-19 08:37:00

2024-12-20 09:30:00

模型訓(xùn)練數(shù)據(jù)

2019-12-11 18:38:56

騰訊云數(shù)據(jù)智能

2025-06-20 09:06:00

2025-01-07 08:40:00

視頻生成AI

2024-11-04 09:35:00

2012-05-29 09:04:30

騰訊云計(jì)算微云

2022-07-17 13:07:26

模型開源

2023-10-17 13:27:49

自動(dòng)駕駛數(shù)據(jù)

2022-12-26 13:55:31

模型框架

2023-04-13 15:40:59

模型論文

2021-06-09 14:01:13

騰訊云云簽約

2025-03-19 10:41:11

2023-05-19 13:24:20

模型AI

2023-12-28 09:49:19

AI工具模型

2010-05-09 23:22:26

云計(jì)算騰訊

2024-08-29 14:05:00

數(shù)據(jù)模型

2023-11-09 15:10:00

訓(xùn)練數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 美国a级毛片免费视频 | 天天操伊人 | 91精品国产一区二区在线观看 | av看片网站 | 一呦二呦三呦国产精品 | 国产日韩一区二区三免费高清 | 在线观看涩涩视频 | 一区二区三区在线观看免费视频 | 亚洲欧美一区二区三区国产精品 | 99久久免费精品视频 | 97碰碰碰| 九九综合| 欧美一级毛片在线播放 | 成年人黄色免费视频 | 日韩免费在线观看视频 | 欧美一级在线观看 | 国产精品欧美一区二区三区 | 天天精品在线 | 91亚洲国产 | 在线第一页 | 天天操操操操操 | 国产91综合 | 欧美日韩一区二区三区四区 | 午夜精品在线观看 | 国产激情精品一区二区三区 | 激情一区 | 日韩在线视频观看 | 狠狠入ady亚洲精品经典电影 | 一区二区在线 | 国产精品久久久久久久久免费丝袜 | 成人精品国产一区二区4080 | 99久久婷婷国产综合精品电影 | 手机看黄av免费网址 | 成年人在线观看视频 | 日韩成人免费中文字幕 | 99精品视频免费观看 | 国产视频一区二区三区四区五区 | 欧美一区二区在线 | 免费一级毛片 | 中文字幕在线二区 | 欧美专区在线 |