成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

港大字節(jié)最新視頻生成模型刷屏!網(wǎng)友直接RIP市場營銷,Sora也不香了

人工智能 新聞
他們提出了一個(gè)全面的數(shù)據(jù)處理流程,包括基于美學(xué)評分的視頻和圖像過濾、基于OCR的內(nèi)容分析及主觀評價(jià)。

剛剛,港大字節(jié)聯(lián)手發(fā)布最新視頻生成模型,讓歪果網(wǎng)友直呼瘋狂。

有人甚至直接RIP市場營銷、TikTok用戶和YouTube創(chuàng)作者。

你敢信,下面這一幕不是來自歐巴電視劇,而是AI生成的!

造出它的新模型名為Goku(悟空),是一系列基于rectified flow Transformer的模型,專為圖像和視頻聯(lián)合生成而設(shè)計(jì),支持文生視頻、圖生視頻、文生圖。

另外還有Goku+,是視頻廣告基礎(chǔ)模型,官方更是直言“它能以比原來低100倍的成本創(chuàng)建廣告視頻”。

Goku生成商品廣告手拿把掐,無論是展示食物還是化妝品都很逼真自然,人物神情也很難看出破綻:

以下生成的吃播視頻更是讓人分不出真假:

再拿出一張白底的皮鞋照片,毫不費(fèi)力就能將其搬到展臺上展示:

甚至能僅憑一張商品圖+文字prompt,就生成帶人物的交互講解視頻。

prompt:

The woman stands behind a colorful Minnie Mouse product, her head gently swaying left and right as she speaks animatedly. Her hands rest on the table, framing the product, while her mouth opens and closes with noticeable emphasis, conveying her enthusiasm and detailed explanation. The camera remains steady, capturing her expressive gestures and the vibrant design of the product in front of her.(女士站在一個(gè)色彩繽紛的米妮老鼠產(chǎn)品后面,她的頭部輕輕地左右擺動,邊說邊展現(xiàn)生動的表情。她的手搭在桌子上,框住了產(chǎn)品,同時(shí)她的嘴巴張開合上,明顯強(qiáng)調(diào)著,傳達(dá)出她的熱情和詳盡的解釋。攝像機(jī)保持穩(wěn)定,捕捉到她富有表現(xiàn)力的手勢和她面前產(chǎn)品的鮮艷設(shè)計(jì)。)

各種場面都能hold住,時(shí)裝秀也不在話下:

在定性和定量評估中,Goku文本到圖像生成GenEval得分0.76和DPG-Bench得分83.65;文本到視頻生成VBench得分84.85,一舉拿下新SOTA。

網(wǎng)友們這下都坐不住了,紛紛稱Goku和Goku+是顛覆性的。

將AI視頻推向下一個(gè)level!

手里的Sora真真兒不香了。

基于流的視頻生成基礎(chǔ)模型

論文介紹,Goku是基于流的視頻生成基礎(chǔ)模型。

具體來說,Goku采用了校正流(Rectified Flow)Transformer實(shí)現(xiàn)圖像和視頻的聯(lián)合生成。

其核心組件包括,圖像-視頻聯(lián)合VAE、Transformer架構(gòu)和校正流公式——

先用圖像-視頻聯(lián)合VAE將圖像和視頻壓縮到共享的潛在空間,再用全注意力Transformer對潛在表示進(jìn)行建模,實(shí)現(xiàn)圖像和視頻的統(tǒng)一生成。

校正流公式基于RF(rectified flow)算法,將其應(yīng)用于圖像-視頻聯(lián)合生成,相比擴(kuò)散模型展現(xiàn)出了更快的收斂速度和更強(qiáng)的理論性質(zhì)。

訓(xùn)練方面,Goku采用了多階段訓(xùn)練策略。

首先進(jìn)行圖文語義對齊預(yù)訓(xùn)練,再進(jìn)行圖像-視頻聯(lián)合訓(xùn)練,最后針對不同模態(tài)進(jìn)行微調(diào),逐步提升模型生成能力。

值得關(guān)注的是,為了訓(xùn)練Goku,研究人員還準(zhǔn)備了大規(guī)模高質(zhì)量數(shù)據(jù)集高效的訓(xùn)練基礎(chǔ)設(shè)施。

數(shù)據(jù)方面,研究人員構(gòu)建了約3600萬視頻和1.6億圖像的大規(guī)模數(shù)據(jù)集,并采用多種數(shù)據(jù)過濾和增強(qiáng)技術(shù)來提高數(shù)據(jù)質(zhì)量。

為此,他們提出了一個(gè)全面的數(shù)據(jù)處理流程,包括基于美學(xué)評分的視頻和圖像過濾、基于OCR的內(nèi)容分析及主觀評價(jià)。

他們還采用多模態(tài)大語言模型來為視頻、圖像數(shù)據(jù)生成信息密集且語境一致的標(biāo)題,并用額外的大語言模型繼續(xù)細(xì)化,以提高其準(zhǔn)確性、流暢性和描述豐富性。

基礎(chǔ)設(shè)施優(yōu)化則包括并行策略、細(xì)粒度激活檢查點(diǎn)技術(shù)、容錯(cuò)機(jī)制以及豆包大模型團(tuán)隊(duì)和港大之前聯(lián)合提出的ByteCheckpoint技術(shù)——

與基線方法相比,ByteCheckpoint在Checkpoint保存上性能提升高達(dá)529.22倍,在加載上,性能提升高達(dá)3.51倍。

為適應(yīng)不同計(jì)算需求和性能要求,研究團(tuán)隊(duì)提供了三種規(guī)模的模型:實(shí)驗(yàn)用的Goku-1B、標(biāo)準(zhǔn)版Goku-2B、Goku-8B。

不過遺憾的是,官方目前只放出了技術(shù)報(bào)告,暫時(shí)還不能玩,網(wǎng)友已經(jīng)迫不及待了~

論文鏈接:https://arxiv.org/abs/2502.04896
項(xiàng)目主頁:https://saiyan-world.github.io/goku/

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2011-05-31 13:06:37

SEO

2024-02-19 07:58:01

OpenAI模型GPT

2012-04-08 14:23:17

iPad

2024-07-30 11:50:00

視頻生成

2025-02-27 12:44:41

2024-07-03 12:05:06

Llama模型架構(gòu)

2019-09-04 09:00:00

人工智能大數(shù)據(jù)技術(shù)

2023-09-18 10:04:46

增強(qiáng)現(xiàn)實(shí)VR

2024-02-19 00:26:34

2013-01-04 10:31:05

移動互聯(lián)網(wǎng)市場營銷CPM

2024-02-19 08:31:10

SoraAIOpenAI

2013-06-23 21:42:21

AdTimeCGBC大數(shù)據(jù)

2025-01-09 13:30:00

2024-02-20 13:09:00

AI視頻

2024-12-12 08:35:58

2024-02-19 00:05:00

視頻AI

2024-03-12 12:16:54

AI模型

2024-10-28 07:30:00

2024-04-07 14:56:22

技術(shù)應(yīng)用

2017-02-06 10:44:27

大數(shù)據(jù)市場營銷
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 亚洲国产精品久久久 | 波多野结衣一区二区三区 | 免费成人在线网 | 欧美色综合 | 操操日| 成人精品免费视频 | 亚洲一区视频在线播放 | 成人午夜网 | 国产精品免费一区二区三区四区 | 亚洲va欧美va人人爽午夜 | 国产精品电影在线观看 | 欧美黑人体内she精在线观看 | 久久久久亚洲 | 91福利在线观看视频 | 欧美日韩在线免费 | 天天操天天操 | 国产综合精品 | 女人精96xxx免费网站p | 婷婷精品| 99综合网 | 男女网站免费观看 | 国产高清视频在线观看 | 国产高清性xxxxxxxx | 9久久婷婷国产综合精品性色 | 81精品国产乱码久久久久久 | 中文字幕日韩欧美一区二区三区 | 最近中文字幕免费 | 91免费版在线观看 | 日韩午夜精品 | 91在线观| 久久久久久91 | 久久这里有精品 | 欧美精品久久久 | 黄色大片视频 | 国产成人精品久久二区二区91 | 久久人人爽人人爽 | 久久精品成人一区 | 亚洲在线免费 | 女同久久另类99精品国产 | 午夜在线影院 | 国产一级毛片视频 |