成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

騰訊出手了!開源最大AI視頻模型,130億參數,性能媲美閉源,擊敗Runway Gen-3、Luma 1.6

原創 精選
人工智能
為了應對用戶提供的提示在語言風格和長度上的差異,團隊對 Hunyuan-Large 模型進行了微調,作為我們的提示重寫模型,將原始用戶提示轉換為模型偏好的提示。

編輯 | 伊風

出品 | 51CTO技術棧(微信號:blog51cto)

AI視頻領域持續不斷有新玩家入局!

12月3日,騰訊出手了,不僅在元寶APP里上線AI視頻功能,還直接開源了混元視頻模型!

圖片圖片

(打開元寶APP,若沒有找到入口的話,可以檢查是否更新到了最新版本,目前可能會有排隊時間。)

騰訊一來就干了票大的:直接開源了AI視頻里最大的模型——130 億參數!

開源地址:https://github.com/Tencent/HunyuanVideo

混元團隊對HunyuanVideo的性能也很有信心,“其視頻生成性能可與領先的閉源模型媲美,甚至在某些方面更勝一籌”。

這源于背后能打的戰績,混元一挑5個閉源模型,排位第一!(注:GEN-3來自Runway 公司;Luma 1.6來自 Luma AI,CNTop系列來自系列騰訊旗下的映技派)

圖片圖片

AI視頻生成的文本對齊、動作質量和視覺質量沒有統一的“題庫”,需要人的判斷。

我們先來看看騰訊自己的demo。

然后小編又用Sora經典的Prompt測試了一下,大家來看看效果如何:

電影預告片,講述了一位30歲的太空人的冒險故事。他戴著一頂紅色羊毛針織摩托車頭盔,背景是藍天和鹽堿沙漠。影片采用電影化風格,使用35毫米膠片拍攝,色彩鮮艷。

一段超真實的特寫視頻,展示了兩艘海盜船在一杯咖啡中激烈交戰,咖啡的液面如同海洋,船只在其中航行,波濤洶涌,炮火四射。

看完了視頻生成效果,我們來看看HunyuanVideo的4個技術層面的特點!

1.統一圖像和視頻生成架構

HunyuanVideo 采用的也是 Transformer 設計,使用了全注意力機制來實現統一的圖像和視頻生成。

具體而言,混元采用了“從雙流到單流”的混合模型設計進行視頻生成。在雙流階段,視頻和文本標記通過多個 Transformer 塊獨立處理,使每種模態能夠學習其適當的調制機制,而不相互干擾。在單流階段,我們將視頻和文本標記連接起來,并將它們輸入到后續的 Transformer 塊,以有效地融合多模態信息。

這一設計捕捉了視覺和語義信息之間的復雜交互,增強了整體模型性能。

2.MLLM 文本編碼器

不同于文本到視頻模型通常使用預訓練的 CLIP 和 T5-XXL 作為文本編碼器(其中 CLIP 使用 Transformer 編碼器,而 T5 使用編碼器-解碼器結構。)

混元采用了預訓練的多模態大型語言模型(MLLM)。

根據他們的技術報告,采用解碼器-only 結構作為文本編碼器,有以下優點:

(i) 與 T5 相比,經過視覺指令微調后的 MLLM 在特征空間中具有更好的圖像-文本對齊性,從而緩解了擴散模型中指令跟隨的難度;(ii) 與 CLIP 相比,MLLM 在圖像細節描述和復雜推理上表現出了更強的能力;(iii) MLLM 可以通過跟隨系統指令來作為零樣本學習者,幫助文本特征更好地關注關鍵信息。此外,MLLM 基于因果注意力,而 T5-XXL 使用的是雙向注意力,后者為擴散模型提供了更好的文本指導。因此,我們引入了額外的雙向標記細化器來增強文本特征。

3.3D VAE

HunyuanVideo 使用 CausalConv3D 訓練 3D VAE,將像素空間的視頻和圖像壓縮到緊湊的潛在空間中。

HunyuanVideo設置了視頻長度、空間和通道的壓縮比分別為 4、8 和 16。這可以顯著減少后續擴散 Transformer 模型所需的標記數量,使我們能夠以原始分辨率和幀率訓練視頻。

4.提示重寫

為了應對用戶提供的提示在語言風格和長度上的差異,團隊對 Hunyuan-Large 模型進行了微調,作為我們的提示重寫模型,將原始用戶提示轉換為模型偏好的提示。

混元提供了兩種重寫模式:普通模式和大師模式,可以通過不同的提示進行調用。普通模式旨在增強視頻生成模型對用戶意圖的理解,促進更準確地解釋用戶提供的指令。大師模式則增強了構圖、照明和鏡頭運動等方面的描述,更傾向于生成具有更高視覺質量的視頻。然而,這種側重點有時可能導致某些語義細節的喪失。

想了解更多AIGC的內容,請訪問:

51CTO AI.x社區

http://m.ekrvqnd.cn/aigc/

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2024-07-30 10:58:49

AI

2024-04-25 13:58:51

開源模型Vicuna

2024-12-03 15:51:45

2024-11-26 12:10:41

2025-04-02 08:50:00

AI視頻生成

2024-04-19 09:17:33

AI模型

2024-12-10 16:00:00

AI開源

2023-12-13 12:55:39

模型數據

2024-05-10 09:10:56

模型訓練

2023-12-12 13:52:00

數據訓練

2022-10-21 08:17:06

開源項目閉源

2022-12-06 14:11:32

開源模型

2023-03-15 10:26:00

模型開源

2023-11-16 12:20:11

2025-02-18 13:30:00

2025-06-30 09:04:00

2020-02-24 10:51:25

微軟開源Windows

2023-12-03 08:49:38

微軟開源

2022-08-18 15:13:37

模型參數

2023-12-12 12:43:04

AI模型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品欧美一区二区三区不卡 | 亚洲国产精品视频 | 91资源在线观看 | 午夜精品久久久久久 | 国产精品九九视频 | 中文字幕日韩欧美一区二区三区 | 精品一级| 午夜三区 | 欧美成人一区二免费视频软件 | 亚洲视频免费在线观看 | av网址在线| 99久久精品一区二区毛片吞精 | 国产日韩精品在线 | 日韩三级电影一区二区 | 超碰人人人人 | 亚洲欧美一区二区三区国产精品 | 羞羞的视频免费在线观看 | 国产成人叼嘿视频在线观看 | 福利片一区二区 | 色狠狠桃花综合 | 国产色网 | 欧美日韩一区不卡 | 国产欧美日韩一区二区三区在线观看 | 欧美日韩在线精品 | 国产精品免费一区二区 | 国产精品99久久久久久宅男 | 亚洲视频在线一区 | 亚洲国产成人久久综合一区,久久久国产99 | 亚洲欧美在线免费观看 | 成人黄在线观看 | 国产美女在线精品免费 | 涩在线| 北条麻妃视频在线观看 | 日本三级日产三级国产三级 | 亚洲精品久久久蜜桃 | 盗摄精品av一区二区三区 | 99国产精品99久久久久久粉嫩 | 成人福利网 | 日韩黄 | 欧美性精品 | 成人伊人网 |