成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

谷歌發(fā)布“Vlogger”模型:單張圖片生成10秒視頻

人工智能 新聞
只需要一張你的頭像、一段講話錄音,就能得到一個本人栩栩如生的演講視頻。

谷歌發(fā)布了一個新的視頻框架:

只需要一張你的頭像、一段講話錄音,就能得到一個本人栩栩如生的演講視頻

視頻時長可變,目前看到的示例最高為10s。

可以看到,無論是口型還是面部表情,它都非常自然。

如果輸入圖像囊括整個上半身,它也能配合豐富的手勢

圖片

網友看完就表示:

有了它,以后咱開線上視頻會議再也不需要整理好發(fā)型、穿好衣服再去了。

嗯,拍一張肖像,錄好演講音頻就可以(手動狗頭)

圖片

用聲音控制肖像生成視頻

這個框架名叫VLOGGER

它主要基于擴散模型,并包含兩部分:

一個是隨機的人體到3D運動(human-to-3d-motion)擴散模型。

另一個是用于增強文本到圖像模型的新擴散架構。

圖片

其中,前者負責將音頻波形作為輸入,生成人物的身體控制動作,包括眼神、表情和手勢、身體整體姿勢等等。

后者則是一個時間維度的圖像到圖像模型,用于擴展大型圖像擴散模型,使用剛剛預測的動作來生成相應的幀。

為了使結果符合特定的人物形象,VLOGGER還將參數(shù)圖像的pose圖作為輸入。

VLOGGER的訓練是在一個超大的數(shù)據(jù)集(名叫MENTOR)上完成的。

有多大?全長2200小時,共包含80萬個人物視頻

其中,測試集的視頻時長也有120小時長,共計4000個人物。

谷歌介紹,VLOGGER最突出的表現(xiàn)是具備多樣性:

如下圖所示,最后的像素圖顏色越深(紅)的部分,代表動作越豐富。

圖片

而和業(yè)內此前的同類方法相比,VLOGGER最大的優(yōu)勢則體現(xiàn)在不需要對每個人進行訓練、也不依賴于面部檢測和裁剪,并且生成的視頻很完整(既包括面部和唇部,也包括肢體動作)等等。

圖片

具體來看,如下表所示:

Face Reenactment方法無法用音頻和文本來控制此類視頻生成。

Audio-to-motion倒是可以音頻生成,方式也是將音頻編碼為3D人臉動作,不過它生成的效果不夠逼真。

Lip sync可以處理不同主題的視頻,但只能模擬嘴部動作。

對比起來,后面的兩種方法SadTaker和Styletalk表現(xiàn)最接近谷歌VLOGGER,但也敗在了不能進行身體控制上,并且也不能進一步編輯視頻。

圖片

說到視頻編輯,如下圖所示,VLOGGER模型的應用之一就是這個,它可以一鍵讓人物閉嘴、閉眼、只閉左眼或者全程睜眼:

圖片

另一個應用則是視頻翻譯:

例如將原視頻的英語講話改成口型一致的西班牙語。

網友吐槽

最后,“老規(guī)矩”,谷歌沒有發(fā)布模型,現(xiàn)在能看的只有更多效果還有論文。

嗯,吐槽也是不少的:

畫質模型、口型抽風對不上、看起來還是很機器人等等。

因此,有人毫不猶豫打上差評:

這就是谷歌的水準嗎?

圖片

有點對不起“VLOGGER”這個名字了。

圖片

——和OpenAI的Sora對比,網友的說法確實也不是沒有道理。。

大家覺得呢?

更多效果:https://enriccorona.github.io/vlogger/

完整論文:https://enriccorona.github.io/vlogger/paper.pdf

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-03-28 13:14:00

數(shù)據(jù)訓練

2023-12-20 14:54:29

谷歌Gen-2視頻

2021-08-13 15:07:02

模型人工智能深度學習

2023-07-14 09:41:01

3DAI

2024-04-07 13:31:51

谷歌VLOGGER視頻

2011-06-24 09:15:26

Chromebook谷歌

2024-11-08 17:34:38

2021-10-20 11:56:35

勒索軟件攻擊數(shù)據(jù)泄露

2024-02-04 19:58:27

谷歌AI視頻生成器

2023-02-06 09:31:07

視頻圖像

2024-10-15 14:08:06

2024-04-08 14:07:51

Animagine開源

2024-02-27 09:19:13

谷歌AI

2023-12-22 09:29:07

模型3D

2024-05-15 07:54:12

GPT-4oAI助手人工智能

2025-02-24 10:03:21

2024-02-19 07:58:01

OpenAI模型GPT

2022-08-19 14:46:16

視覺框架
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 天天操夜夜操 | 日本午夜精品一区二区三区 | 精品一区二区免费视频 | 亚洲国产高清免费 | 国产小u女发育末成年 | 草久久久 | 日韩欧美精品 | 日韩中文字幕在线观看视频 | 日本成人片在线观看 | 国产视频精品在线 | 日韩一区不卡 | 欧美精品一区二区三区蜜桃视频 | 亚洲天堂中文字幕 | 在线免费av电影 | 色综合久 | 一区二区在线 | 午夜成人在线视频 | www.国产精品 | 三级视频在线观看电影 | 日本一区二区三区在线观看 | 成人毛片在线观看 | 玖玖玖av| av在线播放不卡 | 欧美亚洲国语精品一区二区 | 国产一级视频在线播放 | 亚洲免费视频一区二区 | 日韩视频精品 | 日本精品免费 | 国产www.| 一区二区三区在线观看免费视频 | 久久久高清 | 天堂免费 | 91大神在线资源观看无广告 | 欧美精品久久久 | 国产精品一区久久久 | 亚洲国产aⅴ成人精品无吗 国产精品永久在线观看 | 国产精品视频偷伦精品视频 | av免费网站在线观看 | 四虎永久在线精品免费一区二 | 91欧美精品 | 337p日本欧洲亚洲大胆 |