成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

鬼畜配音團(tuán)隊的福音!AI自動生成適配口型,任何語言都可以

新聞 人工智能
這是一個名為Wav2Lip的模型——用來生成準(zhǔn)確的唇語同步視頻的新方法,來自印度海德拉巴大學(xué)的新研究。

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

同樣的臉,放上不同的聲音,還可以做到如此同步。

當(dāng)DeepFake口型造假,效果是這樣。

有沒有發(fā)現(xiàn)這幾個人語音語調(diào)完全相同。

閉眼一聽,完全猜不到到底是誰?吳恩達(dá)?馬斯克?到底是誰在說話?

而和原有的視頻對比,面部變化也不明顯,效果非常自然。

△用YouTube知名數(shù)碼博主Linus配口型

這是一個名為Wav2Lip的模型——用來生成準(zhǔn)確的唇語同步視頻的新方法,來自印度海德拉巴大學(xué)的新研究。

任何人物身份,甚至包括卡通人物,任何語音和語言,都可以將口型視頻高精度同步到任何目標(biāo)語音。

目前該項目已開源,可以去體驗一下Demo版~只需上傳20s的視頻和音頻文件就可以一鍵生成。

鬼畜配音團(tuán)隊的福音!AI自動生成適配口型,任何語言都可以

這項研究在Reddit上一經(jīng)發(fā)布,21小時內(nèi)就獲得200+的熱度。

鬼畜配音團(tuán)隊的福音!AI自動生成適配口型,任何語言都可以

對于這項研究的應(yīng)用前景,作者說,可以應(yīng)用在外文在線講座、配音電影、新聞發(fā)布會,讓人物和聲音的融合更加自然,還省去大量的人力物力。

嗯,胥渡吧、淮秀幫這些配音團(tuán)隊或許可以用的上!

Wav2Lip模型

現(xiàn)有的研究,主要聚焦于在靜態(tài)圖像、或是對視頻中的特定人物生成準(zhǔn)確的唇語動作。

但問題在于,無法準(zhǔn)確的對動態(tài)圖像,比如正在說話的人物,唇部動作進(jìn)行變形,從而導(dǎo)致內(nèi)容與新音頻無法做到完全同步。

就像是當(dāng)你在看音畫不同步的電影時,是不是很難受。

于是,研究人員找到了出現(xiàn)這一問題的關(guān)鍵原因,并通過一個「唇語同步辨別器」來解決。

鬼畜配音團(tuán)隊的福音!AI自動生成適配口型,任何語言都可以

具體而言,有兩個關(guān)鍵原因,現(xiàn)有研究中所使用的損失函數(shù),即L1重構(gòu)損失LipGAN中的判別器損失都不能減少錯誤的唇語同步生成。

鬼畜配音團(tuán)隊的福音!AI自動生成適配口型,任何語言都可以

于是,研究人員就直接通過一個預(yù)先訓(xùn)練好的判別器「well-trained lip-sync expert」,來檢測唇語同步的錯誤,這一判別結(jié)果已經(jīng)相當(dāng)準(zhǔn)確。

此外,研究人員還發(fā)現(xiàn),在產(chǎn)生噪聲的面孔上進(jìn)一步微調(diào),會阻礙判別器測量唇部同步的能力,從而也會影響生成的唇形。

最后,還采用視覺質(zhì)量鑒別器來提高視覺質(zhì)量和同步精度。

[[341016]]

舉個例子,黃色和綠色框的是本次提出的模型,紅色框為現(xiàn)有的最佳方法,文字是他們正在說的語句。

可以看到模型產(chǎn)生的唇形比現(xiàn)有的唇形更加準(zhǔn)確、自然。

模型訓(xùn)練結(jié)果

鬼畜配音團(tuán)隊的福音!AI自動生成適配口型,任何語言都可以

在模型訓(xùn)練階段,作者提出了兩個新指標(biāo), “Lip-Sync Error-Distance”(越低越好)和 “Lip-Sync Error-Confidence”(越高越好),這兩個指標(biāo)可以測量視頻的中的唇語同步精度。

結(jié)果發(fā)現(xiàn),使用Wav2Lip生成的視頻幾乎和真實的同步視頻一樣好。

需要注意的是,這個模型只在LRS2上的訓(xùn)練集上進(jìn)行了訓(xùn)練,在對其他數(shù)據(jù)集的訓(xùn)練時需要對代碼進(jìn)行少量修改。

鬼畜配音團(tuán)隊的福音!AI自動生成適配口型,任何語言都可以

進(jìn)一步的,還對現(xiàn)實的三種視頻類型進(jìn)行了評估。

結(jié)果均表明,Wav2Lip模型都能產(chǎn)生高質(zhì)量、準(zhǔn)確的唇語同步視頻,不過,在對TTS生成的語音進(jìn)行唇語同步時,還有改進(jìn)的空間。

你覺得這項研究如何?

目前,項目已經(jīng)開源,可以自行去體驗一下Demo版哦~

再次提醒:只需上傳20s的視頻和音頻文件,就可以一鍵生成哦!

論文地址:
https://arxiv.org/abs/2008.10010
Demo演示視頻:
https://www.youtube.com/watch?v=SeFS-FhVv3g&feature=youtu.be
GitHub地址:
https://github.com/Rudrabha/Wav2Lip
Demo網(wǎng)址:

https://bhaasha.iiit.ac.in/lipsync/

 

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2013-04-08 12:41:35

JavaScriptJS

2022-03-11 11:40:26

AI數(shù)據(jù)技術(shù)

2009-07-21 09:31:00

Scala操作符

2023-06-14 17:15:41

Sniffnet開源監(jiān)控工具

2023-04-03 09:44:18

2023-04-02 13:46:26

人工智能OpenAI漏洞

2022-03-31 08:15:59

遞歸代碼非遞歸

2021-03-15 21:01:05

微軟Exchange漏洞

2021-11-30 14:50:29

編譯源代碼開源

2021-10-04 14:55:40

Windows 11Windows微軟

2009-11-12 09:51:11

Visual C++項

2014-09-24 13:04:13

微信企業(yè)號

2025-04-29 06:53:36

2022-12-26 09:13:36

ChatGPT數(shù)據(jù)轉(zhuǎn)換器

2013-07-04 09:46:06

X Phone

2011-06-17 14:36:50

Linux

2022-03-07 10:27:03

Linux開源社區(qū)

2023-03-20 18:34:02

營銷大促質(zhì)量保障穩(wěn)定性

2011-08-01 13:43:52

微軟數(shù)據(jù)庫MAC

2021-11-22 17:52:27

神經(jīng)網(wǎng)絡(luò)AI算法
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 日韩成人国产 | 欧美精品一区免费 | 久久精品国产久精国产 | www精品美女久久久tv | 日韩免费在线 | 精品综合久久久 | 日韩精品视频在线播放 | 亚洲精品乱码久久久久久蜜桃91 | 亚洲乱码一区二区 | 日韩成人免费在线视频 | 久久另类 | 国产成人在线一区二区 | 欧美日韩精品久久久免费观看 | 色就干 | 亚洲视频一区二区三区 | 日p视频免费看 | 国产福利91精品一区二区三区 | 精品一区二区三区在线观看国产 | 久久黄网 | 精品一区二区久久久久久久网站 | 久久久久国产精品人 | 一区二区三区欧美 | 日韩在线免费 | 成人午夜毛片 | 亚州无限乱码 | 国产亚洲精品综合一区 | 一区精品视频在线观看 | 精品一区二区在线观看 | 成人在线中文字幕 | 日韩1区| 亚洲色图综合 | 国产高清91| 国产精品综合色区在线观看 | 99视频精品 | 国产1区2区| 久久久久国产一区二区三区四区 | 欧美国产免费 | 一道本不卡视频 | 国产精品久久久久久吹潮 | 免费一二区 | 日本一区二区高清不卡 |