成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI視頻邊生成邊播放!首幀延遲僅1.3秒,生成速度9.4幀/秒|Adobe&MIT新研究

人工智能 新聞
如果你用過視頻生成模型,一定對漫長的等待時間記憶深刻,生成一段10秒的視頻,往往需要等待好幾分鐘才可以開始觀看。

AI生成視頻,邊生成邊實時播放,再不用等了!

Adobe與MIT聯手推出自回歸實時視頻生成技術——CausVid。

思路就像從下載整部電影到直接觀看流媒體的轉變,在模型生成首幀畫面后,視頻便可以即時播放,后續內容則動態生成并無縫銜接。

如果你用過視頻生成模型,一定對漫長的等待時間記憶深刻,生成一段10秒的視頻,往往需要等待好幾分鐘才可以開始觀看。

研究團隊表示,這一延遲的根本原因在于:傳統視頻生成模型普遍采用的雙向注意力機制,每一幀都需要參考前后幀的信息。

這就像寫故事時必須先構思好整個劇情的所有細節才能動筆,在完整視頻生成完畢前,你看不到任何畫面。

為此,他們提出了一種全新的解決方案,通過蒸餾預訓練的雙向擴散模型(DiT),構建自回歸生成模型。

實驗中,CausVid基于自回歸生成的特性,無需額外訓練就能支持多種應用,生成速度和質量均顯著超越現有方法。

圖片

研究團隊還表示將很快開源基于開源模型的實現代碼。

圖片

用雙向教師監督單向自回歸學生模型

如前所述,研究團隊通過蒸餾預訓練的雙向擴散模型(DiT),構建自回歸生成模型。

為了進一步提速實現實時視頻生成,作者通過分布匹配蒸餾(DMD)將生成步驟從50步縮減到僅需4步。

圖片

DMD是一種擴散模型蒸餾技術,將多步擴散模型轉換為快速的單步生成器。DMD此前已在圖像生成中取得成功,Adobe Firefly文生圖的快速模式就是基于此技術。

本次研究團隊將其創新性地應用到視頻擴散模型中,實現了顯著加速。

然而,自回歸模型有一個核心難題——誤差累積

每一幀視頻都基于之前的幀生成,早期生成的任何細微缺陷都會被放大,導致生成的視頻逐漸偏離預期軌跡。

為了解決這一問題,團隊提出了非對稱蒸餾策略。具體來說:

引入一個擁有未來信息的雙向教師模型,在蒸餾訓練階段指導自回歸的單向學生模型。這種教師-學生結構允許模型在生成未來幀時具備更強的精確度。

使用雙向教師模型生成的的噪聲-數據配對來預訓練單向學生模型,提升其后蒸餾訓練過程的穩定性。

在訓練過程中,針對不同時間點的視頻幀施加不同強度的噪聲,這一策略使模型能夠在測試時基于干凈的已生成幀對當前幀進行去噪。

圖片

通過這種創新性的非對稱蒸餾方法,CausVid顯著減少了自回歸模型的誤差累積問題,并生成了更高質量的視頻內容。

這種非對稱蒸餾形式中,學生模型和教師模型使用了不同的架構,而這只有在DMD風格的蒸餾中才可行。其他方法,例如漸進式蒸餾(Progressive Distillation)或一致性模型(Consistency Distillation),都要求學生模型和教師模型使用相同的架構。

下面是自回歸擴散視頻模型的誤差累積示例(左圖)和CausVid結果(右圖)對比:

圖片

實驗效果如何?

實驗中,CausVid表現驚艷:

  • 首幀生成延遲從3.5分鐘降至1.3秒,提速170倍
  • 生成速度從0.6幀/秒提升至9.4幀/秒,提升16倍
  • 生成質量經VBench和用戶調查驗證,優于主流模型例如Meta的MovieGen和智譜的CogVideoX

圖片

得益于單向注意力機制,CausVid完全支持在大語言模型中廣泛應用的KV緩存推理技術,從而顯著提升了生成效率。結合滑動窗口機制,CausVid突破了傳統模型的長度限制。

盡管訓練階段僅接觸過10秒的視頻,CausVid依然能夠生成長達30秒甚至更長的視頻,其生成速度和質量均顯著超越現有方法。

基于自回歸生成的特性,CausVid無需額外訓練就能支持多種應用:

  • 圖片動畫化:將靜態圖片自然轉化為流暢視頻,賦予畫面生命力。
  • 實時視頻風格轉換:如將Minecraft游戲畫面即時轉換為真實場景。這一技術為游戲渲染帶來全新思路:未來可能只需渲染基礎3D幾何信息,由AI實時補充紋理和光影
  • 交互式劇情生成:用戶通過調整提示詞,實時引導視頻劇情發展,帶來全新的創作體驗。

圖片

項目鏈接:https://causvid.github.io/

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-01-15 09:21:57

2024-11-08 17:34:38

2025-06-12 11:57:56

視頻生成模型AI

2022-08-19 14:46:16

視覺框架

2025-05-16 08:37:35

2024-03-11 00:50:00

AI框架數據

2024-03-20 12:27:48

模型訓練

2021-11-10 15:24:25

AI 數據人工智能

2024-03-27 12:46:36

AI模型

2024-08-26 09:35:00

模型文生圖

2021-03-11 17:11:28

人工智能機器學習技術

2024-10-05 08:10:01

2020-09-22 09:39:34

AI 數據人工智能

2024-07-30 11:50:00

視頻生成

2025-02-03 12:16:01

視頻生成AI

2024-10-05 10:57:21

2023-11-20 22:02:54

開源模型

2009-09-02 15:37:26

Windows 7Windows XP操作系統
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人午夜精品一区二区三区 | 成人黄色电影免费 | 亚洲欧洲成人av每日更新 | 老司机免费视频 | 国产在线播放一区二区三区 | 久久9视频 | 国产免费看 | 亚洲视频欧美视频 | 精品美女视频在免费观看 | 亚洲欧美在线免费观看 | 亚洲激情av | 天天爽天天干 | 国产精品色 | 一区二区三区视频在线观看 | 一级黄色绿像片 | 一区二区成人 | 欧美一区二区三区在线播放 | 国产在线一区二区三区 | 国产小视频在线看 | 久久国产激情视频 | 国产日韩一区二区三区 | 天天干天天爱天天爽 | 国产高清精品一区二区三区 | 国产乱码久久久久久 | 亚洲日本视频 | 欧美成人一区二区三区 | 欧美亚洲视频在线观看 | 都市激情亚洲 | 日韩在线观看一区二区三区 | 国产在线观看一区二区 | 亚洲成人综合社区 | 古典武侠第一页久久777 | 天天射色综合 | 人操人人干人 | 精品一区二区电影 | 国产精品精品视频一区二区三区 | 国产一区二区三区四区在线观看 | 国产精品久久9 | 欧美日韩专区 | 亚州春色 | 欧美精品在线看 |