成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<u id="dfqao"></u>

<cite id="dfqao"></cite>

<tfoot id="dfqao"></tfoot>

<button id="dfqao"><form id="dfqao"><s id="dfqao"></s></form></button>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

靠Scaling Laws煉出4D版視頻生成模型，多倫多大學北交大等攜手開源81K高質量數據集

發布于 2024-7-1 09:52

瀏覽

0收藏

只需幾分鐘、一張圖或一句話，就能完成時空一致的4D內容生成。

注意看，這些生成的3D物體，是帶有動作變化的那種。也就是在3D物體的基礎之上，增加了時間維度的運動變化。

靠Scaling Laws煉出4D版視頻生成模型，多倫多大學北交大等攜手開源81K高質量數據集-AI.x社區

這一成果，名為Diffusion4D，來自多倫多大學、北京交通大學、德克薩斯大學奧斯汀分校和劍橋大學團隊。

具體而言，Diffusion4D整理篩選了約81K個4D assets，利用8卡GPU共16線程，花費超30天渲染得到了約400萬張圖片，包括靜態3D物體環拍、動態3D物體環拍，以及動態3D物體前景視頻。

作者表示，該方法是首個利用大規模數據集，訓練視頻生成模型生成4D內容的框架，目前項目已經開源所有渲染的4D數據集以及渲染腳本。

靠Scaling Laws煉出4D版視頻生成模型，多倫多大學北交大等攜手開源81K高質量數據集-AI.x社區

研究背景

過去的方法采用了2D、3D預訓練模型在4D（動態3D）內容生成上取得了一定的突破，但這些方法主要依賴于分數蒸餾采樣（SDS）或者生成的偽標簽進行優化，同時利用多個預訓練模型獲得監督不可避免的導致時空上的不一致性以及優化速度慢的問題。

4D內容生成的一致性包含了時間上和空間上的一致性，它們分別在視頻生成模型和多視圖生成模型中被探索過。基于這個洞見，Diffusion4D將時空的一致性嵌入在一個模型中，并且一次性獲得多時間戳的跨視角監督。

具體來說，使用仔細收集篩選的高質量4D數據集，Diffusion4D訓練了一個可以生成動態3D物體環拍視圖的擴散模型，而后利用已有的4DGS算法得到顯性的4D表征，該方法實現了基于文本、單張圖像、3D到4D內容的生成。

△Text-to-4D

4D數據集

為了訓練4D視頻擴散模型，Diffusion4D收集篩選了高質量的4D數據集。

已開源的Objaverse-1.0包含了42K運動的3D物體，在Objaverse-xl中包含323K動態3D物體。然而這些數據包含著大量低質量的樣本。對此，研究者們設計了運動程度檢測、邊界溢出檢查等篩選方法，選取了共81K的高質量4D資產。

靠Scaling Laws煉出4D版視頻生成模型，多倫多大學北交大等攜手開源81K高質量數據集-AI.x社區

對于每一個4D資產，渲染得到了24個靜態視角的圖（上圖第一行），24個動態視角的環拍圖（上圖第二行），以及24個正面動態圖（上圖第三行）?？傆嫷玫搅?strong>超過四百萬張圖片，總渲染消耗約300 GPU天。

其他數據集細節可以參考項目主頁（文末附上），目前所有渲染完的數據集和原始渲染腳本已開源。

方法

有了4D數據集之后，Diffusion4D訓練具有4D感知的視頻擴散模型（4D-aware video diffusion model）。

過去的視頻生成模型通常不具備3D幾何先驗信息，但近期工作如SV3D，VideoMV等探索了利用視頻生成模型得到靜態3D物體的多視圖，因此Diffusion4D選用了VideoMV作為基礎模型進行微調訓練，使得模型能夠輸出動態環拍視頻。此外設計了如運動強度（motion magnitude）控制模塊、3D-aware classifier-free guidance等模塊增強運動程度和幾何質量。得益于視頻模態具備更強的連貫性優勢，輸出的結果具有很強的時空一致性。

靠Scaling Laws煉出4D版視頻生成模型，多倫多大學北交大等攜手開源81K高質量數據集-AI.x社區

輸出得到動態視角環拍視頻后，Diffusion4D借助已有的4D重建算法將視頻建模得到4D表達。具體來說采用了4DGS的表征形式，以及使用粗粒度、細粒度的兩階段優化策略得到最終的4D內容。從生產環拍視頻到重建4D內容的兩個步驟僅需花費數分鐘時間，顯著快于過去需要數小時的借助SDS的優化式方法。

結果

根據提示信息的模態，Diffusion4D可以實現從文本、圖像、3D到4D內容的生成，在定量指標和user study上顯著優于過往方法。

在生成質量上，Diffusion4D有著更好的細節，更為合理的幾何信息以及更豐富的動作。更多可視化結果可以參考項目主頁。

靠Scaling Laws煉出4D版視頻生成模型，多倫多大學北交大等攜手開源81K高質量數據集-AI.x社區

總結

Diffusion4D是首個利用視頻生成模型來實現4D內容生成的框架，通過使用超81K的數據集、以及精心設計的模型架構實現了快速且高質量的4D內容。未來，如何最大程度發揮4D數據集價值，如何生成多物體、復雜場景的4D內容仍有很大的探索空間！

項目地址：??https://vita-group.github.io/Diffusion4D/???
論文地址：???https://arxiv.org/abs/2405.16645??

本文轉自量子位，作者：量子位

原文鏈接:??https://mp.weixin.qq.com/s/-yxB8bsDtnAzSO-WYRwpww??

標簽

已于2024-7-1 09:53:26修改

贊

收藏

回復

舉報

回復

相關推薦

Arena-Hard：開源高質量大模型評估基準

Aceryt ? 4723瀏覽 ? 0回復
ICLR 2024 Spotlight | 無懼中間步驟，MUSTARD可生成高質量數學推理數據

輕薄滴假象 ? 3668瀏覽 ? 0回復
Meta 聯合紐約大學和華盛頓大學提出MetaCLIP，帶你揭開CLIP的高質量數據之謎。

輕薄滴假象 ? 3007瀏覽 ? 0回復
阿里巴巴AI研究團隊打破視頻生成技術壁壘，EasyAnimate實現高質量長視頻生成

Syrupup ? 4316瀏覽 ? 0回復
高質量3D生成最有希望的一集？GaussianCube在三維生成中全面超越NeRF

輕薄滴假象 ? 3025瀏覽 ? 0回復
ShareGPT4V作者團隊又一力作！百萬高質量視頻-字幕數據助力社區提升多模態大模型視頻理解及生成能力

輕薄滴假象 ? 2877瀏覽 ? 0回復
百萬級高質量視頻數據集發布，登頂抱抱臉數據集排行榜，中科大&上海AI Lab等出品

Crystalcxt ? 3066瀏覽 ? 0回復
4K4D:實時4K分辨率4D視圖合成

angel ? 2941瀏覽 ? 0回復
僅需1分鐘，文本生成高質量3D模型—Meta 3D-Gen

Aceryt ? 3666瀏覽 ? 0回復
大模型微調技巧 | 高質量指令數據篩選方法-MoDS

NLP工作站 ? 4128瀏覽 ? 0回復
1890美元訓出11.6億參數高質量文生圖模型

duhorse ? 2444瀏覽 ? 0回復
國外驚訝，中國文生視頻模型超高質量！

Aceryt ? 3436瀏覽 ? 0回復
長視頻生成再突破！高質量連貫達600幀 | ConFiner：專家鏈加持的免訓練長視頻生成器

angel ? 2734瀏覽 ? 0回復
如何獲取高質量數據進行代碼指令調優？

NLP工作站 ? 2818瀏覽 ? 0回復
視頻生成更高質量，更連貫！關鍵幀插值創新技術——Generative Inbetweening開源

angel ? 3658瀏覽 ? 0回復
3D生成基礎模型來了！只需5秒，高質量3D資產規?；?em>生成！南洋理工等重磅開源3DTopia-XL

angel ? 2772瀏覽 ? 0回復
革新3D材質生成！Material Anything：端到端打造任意3D物體的高質量材質！

angel ? 3060瀏覽 ? 0回復
大模型訓練之訓練數據準備，即怎么準備高質量的訓練數據集？

AI探索時代 ? 3848瀏覽 ? 0回復
ControlNet作者：視頻生成論文Frameback，超低顯存生成高質量視頻，ComfyUI必備組件！

石映飛云 ? 1565瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

何愷明開辟分形圖像生成新范式！計算效率提高4000倍，首次實現高分辨率逐像素生成 2025-02-26 11:59:41發布
達摩院開源VideoLLaMA3：僅7B大小，視頻理解拿下SOTA | 在線可玩 2025-02-14 13:02:21發布

熱門推薦

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

AI Agents開源工具棧全解析~ 0回復

效果&成本雙突破！快手提出端到端生成式推薦系統OneRec！ 0回復

我把DeepSeek微調參數扒光了，顯存和性能優化的秘密都在這 0回復

上一篇：一次可輸入多張圖像，還能多輪對話！最新開源數據集，讓AI聊天更接近現實

下一篇： AI恐怖體操視頻腿腳亂飛、大變活人，LeCun：視頻生成模型根本不懂物理

社區精華內容

目錄

主站蜘蛛池模板：黄色一级电影在线观看 | 亚欧精品一区 | 精品国产91乱码一区二区三区 | 欧美日韩电影一区二区 | 国产一区二区三区四区在线观看 | 久久99精品久久久久蜜桃tv | 亚洲不卡 | av大片在线 | 成人小视频在线观看 | 亚洲综合国产精品 | 久久久人成影片免费观看 | 国产成人精品视频在线观看 | 亚洲高清一区二区三区 | 国产在线播放av | 久久精品亚洲欧美日韩久久 | 亚洲精品68久久久一区 | 欧美精品一二三 | 精品久久久久久亚洲综合网 | 黄色骚片 | 日韩一区二区福利 | 嫩草网 | 日韩欧美在线一区二区 | 91精品国产综合久久久久 | 亚洲国产网 | 天天干天天爱天天操 | 九九热在线免费视频 | 国产精品久久久久久久久久久久久 | 国产成人精品一区 | 日本人爽p大片免费看 | 久久综合入口 | 91精品国产乱码久久久 | 日本免费视频在线观看 | 成人黄在线观看 | 亚洲成人播放器 | 久久国产精品久久 | 欧美男人的天堂 | a级在线免费 | 国产精品污www一区二区三区 | 宅女噜噜66国产精品观看免费 | 国产精品高潮呻吟久久av黑人 | 国产精品久久久久久久久 |

<label id="wybem"></label>

<kbd id="wybem"><acronym id="wybem"></acronym></kbd><ol id="wybem"><tr id="wybem"><menuitem id="wybem"></menuitem></tr></ol>