成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<table id="zostp"></table>

<tfoot id="zostp"></tfoot>

<kbd id="zostp"><small id="zostp"><button id="zostp"></button></small></kbd>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

超越Sora！全球首個帶背景音樂，文生1080超高清視頻模型

發布于 2024-10-8 10:22

瀏覽

0收藏

全球社交巨頭Meta發布最新大模型Movie Gen，正式進軍文生視頻領域。

Movie Gen共有300億參數，能以每秒16幀直接生成16秒的1080P超高清視頻，還提供精準的視頻剪輯、個性化功、不同寬高比適配等多元化功能。

最大技術亮點是，Movie Gen能直接生成帶精準配樂的視頻，目前Sora、Runway、Luma等一線產品都無法提供該功能。

超越Sora！全球首個帶背景音樂，文生1080超高清視頻模型-AI.x社區

有網友對Movie Gen的全面化功能相當震驚，表示，Meta比OpenAI更高的發布了Sora。

超越Sora！全球首個帶背景音樂，文生1080超高清視頻模型-AI.x社區

基本上都是一片Amazing，足以看出Movie Gen的超強性能。

超越Sora！全球首個帶背景音樂，文生1080超高清視頻模型-AI.x社區

超越Sora！全球首個帶背景音樂，文生1080超高清視頻模型-AI.x社區

超越Sora！全球首個帶背景音樂，文生1080超高清視頻模型-AI.x社區

Sora掀起了文生視頻風口，但是它自己卻莫名消失了~

超越Sora！全球首個帶背景音樂，文生1080超高清視頻模型-AI.x社區

目前，Meta還沒有公布開源該模型，但已經有人迫不及待了。

超越Sora！全球首個帶背景音樂，文生1080超高清視頻模型-AI.x社區

這是目前最強的文生視頻模型，我們很快能用它制作電影了。

超越Sora！全球首個帶背景音樂，文生1080超高清視頻模型-AI.x社區

Movie Gen功能簡單介紹

文生視頻是Movie Gen的核心模塊，是基于Transformer架構開發而成，專門優化了文本到圖像和文本到視頻的生成。Movie Gen能夠生成長達16秒、每秒16幀的1080P超高清視頻，支持73K token上下文。

通過理解文本提示，結合預訓練時學習到的視覺知識，生成與文本描述相匹配的視頻內容。這一模塊的技術創新在于其能夠推理對象運動、主體-對象交互和相機運動，從而生成各種概念的合理動作。

超越Sora！全球首個帶背景音樂，文生1080超高清視頻模型-AI.x社區

在訓練過程中，Meta采用了大規模的互聯網圖像、視頻和音頻數據，通過復雜的數據策劃和過濾流程，確保了模型訓練數據的多樣性和質量。

此外，為了提高生成視頻的質量和一致性，Meta還引入了監督式微調，使用人工策劃的高質量視頻數據對模型進行進一步的訓練。

個性化視頻生成是在基礎視頻模型上進行了擴展，支持生成包含特定人物身份的視頻內容。例如，輸入一個人的圖像和文本提示，模型能夠生成包含該人物并具有豐富細節的視頻。

超越Sora！全球首個帶背景音樂，文生1080超高清視頻模型-AI.x社區

Meta使用了一種全新的訓練策略，通過在模型訓練中加入人臉圖像和文本提示的配對數據，使模型學會如何將特定的人物身份信息融入到視頻生成過程中。

精確視頻編輯是Movie Gen的另外一大技術創新，允許用戶通過文本提示對視頻進行精確編輯。

超越Sora！全球首個帶背景音樂，文生1080超高清視頻模型-AI.x社區

Meta通過創新的訓練方法，使模型能夠理解文本提示中的編輯指令，并將其應用于視頻內容的修改中。包括添加、移除或替換視頻中的元素，以及進行背景或風格等全局性的修改。

能生成帶背景音樂的視頻，流匹配和DiT是關鍵技術。流匹配是一種創新的生成式建模方法，通過構建一個最優傳輸路徑來指導生成過程，從而確保生成的內容既連貫又富有創意。與傳統的擴散模型相比，流匹配不僅提高了訓練效率，還增強了推理階段的表現力。

超越Sora！全球首個帶背景音樂，文生1080超高清視頻模型-AI.x社區

DiT一種經過調整的變壓器架構，能夠更好地處理音頻數據。通過對歸一化層輸出進行縮放和偏移，并對自注意力及前饋網絡層輸出進行縮放，實現了對音頻信號更精細的控制。同時，通過一個多層感知機來預測調制參數，進一步優化了模型性能。

超越Sora！全球首個帶背景音樂，文生1080超高清視頻模型-AI.x社區

為了適配不同的設備，針對視頻中的位置信息編碼問題，Movie Gen使用了一種因子化的可學習位置嵌入方式。這種方法可以靈活地適應不同尺寸、寬高比以及視頻長度的輸入，避免了傳統固定長度位置編碼帶來的限制。

超越Sora！全球首個帶背景音樂，文生1080超高清視頻模型-AI.x社區

Movie Gen通過將空間坐標以及時間坐標轉化為獨立的嵌入向量，再將它們相加得到最終的位置表示，從而有效減少了因位置編碼不當導致的畫面扭曲或變形現象，尤其是在時間維度上表現尤為明顯。

超越Sora！全球首個帶背景音樂，文生1080超高清視頻模型-AI.x社區

為了降低性能消耗，Movie Gen引入了多維度并行化策略，包括數據并行、張量并行、序列并行以及上下文并行。這種三維并行化設計允許模型在參數數量、輸入token數和數據集大小三個軸向上進行擴展，同時也能橫向擴展至更多的GPU設備上。

特別是在處理高分辨率視頻時，由于自注意力機制本身的計算復雜度較高，因此高效的并行化策略對于減少所需的計算資源至關重要。

論文地址：https://ai.meta.com/static-resource/movie-gen-research-paper

本文轉自 AIGC開放社區，作者：AIGC開放社區

原文鏈接:??https://mp.weixin.qq.com/s/Eb8N-bKB99P4vMqCIwtytg??

標簽

贊

收藏

回復

舉報

回復

相關推薦

文生視頻時代已到，百度、訊飛、字節誰能率先做出“國產Sora”？

liutao988 ? 2736瀏覽 ? 0回復
詳解Latte：應用于文生視頻的DiT模型

jordana ? 4113瀏覽 ? 0回復
音樂版Sora！文生超逼真歌曲，可自定義歌詞、時間延長

Aceryt ? 4088瀏覽 ? 0回復
首個國產音樂SOTA模型來了！專為中文優化，免費用，不限曲風

輕薄滴假象 ? 2751瀏覽 ? 0回復
音樂人值得嘗試的十大文本轉音樂AI平臺

51CTO內容精選 ? 3955瀏覽 ? 0回復
谷歌發布Veo：文生超1分鐘、1080P視頻，媲美Sora

Aceryt ? 4660瀏覽 ? 0回復
媲美Sora，免費使用！帶物理模擬的，文生視頻模型

Aceryt ? 3837瀏覽 ? 0回復
首個多模態視頻競技場Video-MME來了！Gemini全面超越GPT-4o，Jeff Dean連轉三次

duhorse ? 2920瀏覽 ? 0回復
與Sora同架構，高效、連貫文生視頻模型

Aceryt ? 2414瀏覽 ? 0回復
比肩Sora，免費試用！國外驚訝，中國文生視頻模型超高質量！

Aceryt ? 3436瀏覽 ? 0回復
文生視頻模型Runway、Luma同時開放API

Aceryt ? 2957瀏覽 ? 0回復
比肩Sora！快手、北大開源，超高清10秒、24幀視頻模型

Aceryt ? 2467瀏覽 ? 0回復
微軟發布Mora視頻模型，吊打Sora？

echo_ning ? 2160瀏覽 ? 0回復
INTELLECT-1：全球首個去中心化訓練的 10B 參數大模型

Syrupup ? 3300瀏覽 ? 0回復
Sora來了！文字秒變視頻，附技術細節

云原生AI百寶箱 ? 2455瀏覽 ? 0回復
全球首個混合推理模型Claude 3.7 Sonnet發布，編碼能力直接起飛！

AI博物院 ? 2816瀏覽 ? 0回復
音樂界的DeepSeek來了！全球首個音樂推理大模型Mureka O1上線，音樂領域要迎來大變革了？

算家計算 ? 1738瀏覽 ? 0回復
超越Sora！谷歌推出Veo 2，生成8秒超逼真視頻

Aceryt ? 1638瀏覽 ? 0回復
中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！

angel ? 3427瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

剛剛，OpenAI發布GPT-image-1模型，更強吉卜力版本來啦 2025-04-24 09:57:36發布
字節跳動開源多模態AI Agent—UI-TARS-1.5 2025-04-23 11:55:00發布

熱門推薦

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

AI Agents開源工具棧全解析~ 0回復

效果&成本雙突破！快手提出端到端生成式推薦系統OneRec！ 0回復

我把DeepSeek微調參數扒光了，顯存和性能優化的秘密都在這 0回復

上一篇：蘋果開源高清擴散模型MDM，能在多個分辨率下同時去噪

下一篇：谷歌提出視覺記憶方法，讓大模型訓練數據更靈活

社區精華內容

目錄

主站蜘蛛池模板：超碰成人免费观看 | 日韩av网址在线观看 | 国产精久久久 | 欧美日韩免费在线 | 一区二区三区视频 | www日本在线观看 | 国产91丝袜在线播放 | 久久久国产精品网站 | 日日摸日日添日日躁av | 天堂中文字幕av | 久久中文视频 | 视频一区二区三区中文字幕 | 91传媒在线播放 | 日韩精品一区二区三区在线观看 | 免费观看黄网站 | 婷婷色国产偷v国产偷v小说 | 日韩精品无码一区二区三区 | 国产精品免费一区二区三区 | 免费在线视频a | 日韩在线一区二区 | 中文字幕97| 国产真实精品久久二三区 | 99久久精品国产一区二区三区 | 中文字幕亚洲欧美日韩在线不卡 | 天堂在线中文字幕 | 亚洲日本欧美 | 9999国产精品欧美久久久久久 | 天天干天天玩天天操 | 国产中文字幕在线观看 | 伊人免费观看视频 | 成人区一区二区三区 | 福利一区在线观看 | 特黄特黄a级毛片免费专区 av网站免费在线观看 | 日日骚网 | av一区二区三区四区 | 婷婷综合| 精品成人佐山爱一区二区 | 黄色片网站在线观看 | 亚洲香蕉 | 亚洲一区中文字幕 | 一区二区三区四区电影 |

<video id="cbjcj"><abbr id="cbjcj"></abbr></video>

<table id="cbjcj"></table>

<strike id="cbjcj"><small id="cbjcj"><label id="cbjcj"></label></small></strike>

<kbd id="cbjcj"></kbd>

<form id="cbjcj"></form>