成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

順著網(wǎng)線爬過來成真了,Audio2Photoreal通過對話就能生成逼真表情與動作

人工智能 新聞
如果你正在與一個遠程朋友聊天,不是通過冰冷的屏幕文字,也不是缺乏表情的虛擬形象,而是一個逼真、動態(tài)、充滿表情的數(shù)字化虛擬人。

當你和朋友隔著冷冰冰的手機屏幕聊天時,你得猜猜對方的語氣。當 Ta 發(fā)語音時,你的腦海中還能浮現(xiàn)出 Ta 的表情甚至動作。如果能視頻通話顯然是最好的,但在實際情況下并不能隨時撥打視頻。

如果你正在與一個遠程朋友聊天,不是通過冰冷的屏幕文字,也不是缺乏表情的虛擬形象,而是一個逼真、動態(tài)、充滿表情的數(shù)字化虛擬人。這個虛擬人不僅能夠完美地復現(xiàn)你朋友的微笑、眼神,甚至是細微的肢體動作。你會不會感到更加的親切和溫暖呢?真是體現(xiàn)了那一句「我會順著網(wǎng)線爬過來找你的」。

這不是科幻想象,而是在實際中可以實現(xiàn)的技術了。

面部表情和肢體動作包含的信息量很大,這會極大程度上影響內(nèi)容表達的意思。比如眼睛一直看著對方說話和眼神基本上沒有交流的說話,給人的感覺是截然不同的,這也會影響另一方對溝通內(nèi)容的理解。我們在交流過程中對這些細微的表情和動作都有著極敏銳的捕捉能力,并用它們來形成對交談伙伴意圖、舒適度或理解程度的高級理解。因此,開發(fā)能夠捕捉這些微妙之處的高度逼真的對話虛擬人對于互動至關重要。

為此,Meta 與加利福尼亞大學的研究者提出了一種根據(jù)兩人對話的語音音頻生成逼真虛擬人的方法。它可以合成各種高頻手勢和表情豐富的面部動作,這些動作與語音非常同步。對于身體和手部,他們利用了基于自回歸 VQ 的方法和擴散模型的優(yōu)勢。對于面部,他們使用以音頻為條件的擴散模型。然后將預測的面部、身體和手部運動渲染為逼真虛擬人。研究者證明了在擴散模型上添加引導姿勢條件能夠生成比以前的作品更多樣化和合理的對話手勢。

圖片


  • 論文地址:https://huggingface.co/papers/2401.01885
  • 項目地址:https://people.eecs.berkeley.edu/~evonne_ng/projects/audio2photoreal/

研究者表示,他們是第一個研究如何為人際對話生成逼真面部、身體和手部動作的團隊。與之前的研究相比,研究者基于 VQ 和擴散的方法合成了更逼真、更多樣的動作。

方法概覽

研究者從記錄的多視角數(shù)據(jù)中提取潛在表情代碼來表示面部,并用運動骨架中的關節(jié)角度來表示身體姿勢。如圖 3 所示,本文系統(tǒng)由兩個生成模型組成,在輸入二人對話音頻的情況下,生成表情代碼和身體姿勢序列。然后,表情代碼和身體姿勢序列可以使用神經(jīng)虛擬人渲染器逐幀渲染,該渲染器可以從給定的相機視圖中生成帶有面部、身體和手部的完整紋理頭像。

需要注意的是,身體和臉部的動態(tài)變化非常不同。首先,面部與輸入音頻的相關性很強,尤其是嘴唇的運動,而身體與語音的相關性較弱。這就導致在給定的語音輸入中,肢體手勢有著更加復雜的多樣性。其次,由于在兩個不同的空間中表示面部和身體,因此它們各自遵循不同的時間動態(tài)。因此,研究者用兩個獨立的運動模型來模擬面部和身體。這樣,臉部模型就可以「主攻」與語音一致的臉部細節(jié),而身體模型則可以更加專注于生成多樣但合理的身體運動。

面部運動模型是一個擴散模型,以輸入音頻和由預先訓練的唇部回歸器生成的唇部頂點為條件(圖 4a)。對于肢體運動模型,研究者發(fā)現(xiàn)僅以音頻為條件的純擴散模型產(chǎn)生的運動缺乏多樣性,而且在在時間序列上顯得不夠協(xié)調(diào)。但是,當研究者以不同的引導姿勢為條件時,質量就會提高。因此,他們將身體運動模型分為兩部分:首先,自回歸音頻條件變換器預測 1fp 時的粗略引導姿勢(圖 4b),然后擴散模型利用這些粗略引導姿勢來填充細粒度和高頻運動(圖 4c)。關于方法設置的更多細節(jié)請參閱原文。

圖片

實驗及結果

研究者根據(jù)真實數(shù)據(jù)定量評估了 Audio2Photoreal 有效生成逼真對話動作的能力。同時,還進行了感知評估,以證實定量結果,并衡量 Audio2Photoreal 在給定的對話環(huán)境中生成手勢的恰當性。實驗結果表明,當手勢呈現(xiàn)在逼真的虛擬化身上而不是 3D 網(wǎng)格上時,評估者對微妙手勢的感知更敏銳。

研究者將本文方法與 KNN、SHOW、LDA 這三種基線方法根據(jù)訓練集中的隨機運動序列進行了生成結果對比。并進行了消融實驗,測試了沒有音頻或指導姿勢的條件下、沒有引導姿勢但基于音頻的條件下、沒有音頻但基于引導姿勢的條件下 Audio2Photoreal 每個組件的有效性。

定量結果

表 1 顯示,與之前的研究相比,本文方法在生成多樣性最高的運動時,F(xiàn)D 分數(shù)最低。雖然隨機具有與 GT 相匹配的良好多樣性,但隨機片段與相應的對話動態(tài)并不匹配,導致 FD_g 較高。

圖 5 展示了本文方法所生成的引導姿勢的多樣性。通過基于 VQ 的變換器 P 采樣,可以在相同音頻輸入的條件下生成風格迥異的姿勢。

圖片

如圖 6 所示,擴散模型會學習生成動態(tài)動作,其中的動作會與對話音頻更加匹配。

圖片

圖 7 表現(xiàn)了 LDA 生成的運動缺乏活力,動作也較少。相比之下,本文方法合成的運動變化與實際情況更為吻合。

此外,研究者還分析了本文方法在生成嘴唇運動方面的準確度。如表 2 中的統(tǒng)計所示,Audio2Photoreal 顯著優(yōu)于基線方法 SHOW,以及在消融實驗中移除預訓練的嘴唇回歸器后的表現(xiàn)。這一設計改善了說話時嘴形的同步問題,有效避免了不說話時口部出現(xiàn)隨機張開和閉合的動作,使得模型能夠實現(xiàn)更出色的的嘴唇動作重建,同時降低了面部網(wǎng)格頂點(網(wǎng)格 L2)的誤差。

定性評估

由于對話中手勢的連貫性難以被量化,研究者采用了定性方法做評估。他們在 MTurk 進行了兩組 A/B 測試。具體來說,他們請測評人員觀看本文方法與基線方法的生成結果或本文方法與真實情景的視頻對,請他們評估哪個視頻中的運動看起來更合理。

如圖 8 所示,本文方法顯著優(yōu)于此前的基線方法 LDA,大約有 70% 的測評人員在網(wǎng)格和真實度方面更青睞 Audio2Photoreal。

如圖 8 頂部圖表所示,和 LDA 相比,評估人員對本文方法的評價從「略微更喜歡」轉變?yōu)椤笍娏蚁矚g」。和真實情況相比,也呈現(xiàn)同樣的評價。不過,在逼真程度方面,評估人員還是更認可真實情況,而不是 Audio2Photoreal。

更多技術細節(jié),請閱讀原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-02-05 13:28:14

AI音頻虛擬人像

2020-01-08 08:50:33

AI 數(shù)據(jù)人工智能

2024-11-21 16:43:57

2021-10-29 15:44:11

鴻蒙HarmonyOS應用

2019-07-05 09:14:50

Linux操作系統(tǒng)通信

2021-10-25 11:15:53

黑客安全網(wǎng)絡

2020-11-09 14:37:03

微信彩蛋翻譯

2015-07-27 18:23:13

google

2023-02-24 10:22:15

2023-12-05 14:21:44

百度搜索創(chuàng)新大賽

2021-02-02 10:39:15

AI人臉識別3D人臉

2011-03-02 09:21:14

iPad蘋果喬布斯

2024-02-23 07:10:13

文字渲染Sora人工智能

2023-05-16 14:17:00

數(shù)字人

2024-12-09 14:00:00

AI生成

2020-12-11 13:00:24

QQ電視移動應用

2023-07-30 15:19:18

RewindiPhone

2014-03-06 17:13:03

2015-05-05 14:50:21

Python不需要操作系統(tǒng)
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: av中文字幕在线 | cao视频 | 狠狠入ady亚洲精品经典电影 | 天天艹| 国产亚洲一区二区三区在线观看 | 久热电影| 中文字幕丁香5月 | 亚洲国产精品视频一区 | 天天干天天谢 | 国产亚洲一区二区三区在线观看 | 欧美日本在线 | 国产一区二区久久 | 亚洲日韩中文字幕一区 | 亚洲人人舔人人 | 久久久久国产 | 久久久久久国产精品 | 一区二区三区电影在线观看 | 一级在线观看 | 91视频导航 | 2019天天操| 日韩欧美在线观看 | 成人福利电影 | 国产成人免费视频 | 午夜精品久久久久久久久久久久久 | av中文字幕在线 | 中文字幕日韩欧美一区二区三区 | 国产精品国产a级 | 久久亚洲国产 | 国产精品久久久精品 | 伊人色综合久久久天天蜜桃 | 视频一区在线 | 久久久久亚洲av毛片大全 | 精品久久国产 | 午夜二区 | 一区二区三区在线 | 欧美一区二区三区在线观看 | 午夜激情影院 | 亚洲精品中文字幕在线 | 久久精品免费 | 国产在线观看福利 | 精品欧美黑人一区二区三区 |