成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

零樣本 | MusicMagus:基于擴散模型的零樣本文本驅(qū)動音樂編輯新方案

人工智能
當(dāng)前的文本到音樂生成模型已取得長足進展,但音樂創(chuàng)作往往需要反復(fù)修改,而如何在保持音樂整體結(jié)構(gòu)的同時,精準編輯特定屬性仍然是個挑戰(zhàn)。

一眼概覽

MusicMagus 提出了一種基于擴散模型的零樣本文本到音樂編輯方法,可在不額外訓(xùn)練的情況下,通過文本編輯修改音樂的風(fēng)格、音色和樂器,同時保持其他屬性不變。實驗表明,該方法在風(fēng)格轉(zhuǎn)換和音色轉(zhuǎn)換方面優(yōu)于現(xiàn)有零樣本方法,并在某些任務(wù)上超越監(jiān)督學(xué)習(xí)方法。

核心問題

當(dāng)前的文本到音樂生成模型已取得長足進展,但音樂創(chuàng)作往往需要反復(fù)修改,而如何在保持音樂整體結(jié)構(gòu)的同時,精準編輯特定屬性仍然是個挑戰(zhàn)。現(xiàn)有方法依賴手工標注數(shù)據(jù)集特定任務(wù)訓(xùn)練,限制了編輯的靈活性和通用性。因此,本研究的核心問題是:

如何在無需額外訓(xùn)練的情況下,實現(xiàn)靈活的文本驅(qū)動音樂編輯?

技術(shù)亮點

1. 無監(jiān)督零樣本編輯:MusicMagus 不依賴成對訓(xùn)練數(shù)據(jù),而是利用預(yù)訓(xùn)練擴散模型的潛在表示空間,直接進行文本驅(qū)動的音樂編輯。

2. 語義一致性約束:通過向量化的編輯方向交叉注意力約束,確保編輯后的音樂在保持原有結(jié)構(gòu)的同時,僅修改目標屬性。

3. 兼容現(xiàn)有模型:無需重新訓(xùn)練,直接集成于現(xiàn)有的文本到音樂擴散模型(如 AudioLDM 2),提升可用性。

方法框架

圖片圖片

MusicMagus 的編輯過程包括以下步驟:

1. 文本變換:通過單詞替換(如“鋼琴”→“吉他”)來定義編輯目標,并計算語義變換向量,以捕捉文本變化的方向。

2. 擴散模型編輯

? 在潛在空間應(yīng)用編輯向量,調(diào)整擴散模型的語義條件;

? 施加交叉注意力約束,確保非編輯部分保持不變。

3. 音樂重建:利用擴散模型去噪生成新的音樂片段,實現(xiàn)零樣本風(fēng)格或音色轉(zhuǎn)換。

實驗結(jié)果速覽

圖片圖片

(1) 主觀實驗

音色轉(zhuǎn)換任務(wù)中(鋼琴 → 風(fēng)琴、鋼琴 → 中提琴等),MusicMagus 在相關(guān)性(REL)、整體質(zhì)量(OVL)和一致性(CON)方面均優(yōu)于AudioLDM 2 和 Transplayer。

(2) 客觀實驗

MusicMagus 在語義一致性(CLAP 相似度)和旋律一致性(Chroma 相似度)方面均優(yōu)于基線。

實用價值與應(yīng)用

MusicMagus 適用于多種音樂編輯場景:

音樂制作:藝術(shù)家可通過文本指令快速調(diào)整風(fēng)格或替換樂器,提升音樂創(chuàng)作效率。

影視配樂:可根據(jù)導(dǎo)演需求調(diào)整背景音樂風(fēng)格,而無需重新錄制。

游戲音效:允許游戲開發(fā)者通過文本指令靈活調(diào)整游戲配樂,增強互動體驗。

此外,該方法還可用于真實音樂編輯,通過DDIM 反演對真實音頻進行修改,但目前仍受模型泛化能力的限制。

開放問題

長音頻編輯:當(dāng)前方法主要針對短音樂片段,未來如何擴展至完整歌曲或長音頻編輯

多樂器混合編輯:目前僅支持單個音色轉(zhuǎn)換,如何在不影響整體結(jié)構(gòu)的情況下修改多個樂器或風(fēng)格

更高音質(zhì)生成:現(xiàn)有擴散模型生成的音樂仍受16kHz 采樣率限制,如何提高音質(zhì)以滿足專業(yè)需求?

責(zé)任編輯:武曉燕 來源: 萍哥學(xué)AI
相關(guān)推薦

2025-02-06 11:25:50

2025-02-08 11:12:34

ZAPS影像模型

2024-06-25 09:35:04

模型訓(xùn)練

2024-11-20 16:51:00

目標檢測模型

2023-02-24 10:22:15

2024-09-12 08:00:00

2023-07-12 09:00:00

自動語音識別機器學(xué)習(xí)

2024-08-28 14:20:00

數(shù)據(jù)模型

2023-03-06 16:17:13

2021-10-25 09:06:29

模型人工智能計算

2023-02-03 16:31:02

模型

2025-01-26 10:50:00

模型視頻生成

2024-11-18 08:40:00

2021-09-08 17:23:33

谷歌模型開發(fā)

2024-02-07 12:13:19

AI數(shù)據(jù)

2024-07-31 14:06:00

2021-07-24 10:19:14

AI 數(shù)據(jù)克隆

2024-11-06 16:00:00

AI訓(xùn)練

2024-03-15 12:49:40

AI訓(xùn)練

2024-12-26 16:30:00

AI設(shè)計數(shù)據(jù)
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 艹逼网 | 伊人性伊人情综合网 | 男人天堂手机在线视频 | 夜夜草 | 久久久久久久综合色一本 | 成年人免费在线视频 | 成人在线观看免费视频 | 国产精品精品 | 伊人中文网 | 一区二区av | 91在线看网站 | 久久久久成人精品 | 国产福利在线播放 | 欧美日韩国产一区二区三区 | 美女福利网站 | 亚洲天堂中文字幕 | 日韩在线欧美 | 欧美性乱 | 日韩精品久久久久久 | 国产美女精品视频 | 欧美成人免费 | 欧美一二区 | 国产中文字幕网 | 亚洲一区视频 | 懂色av一区二区三区在线播放 | 91精品国产91久久久久游泳池 | 日韩在线一区二区三区 | 精品av久久久久电影 | 日韩视频中文字幕 | 成人在线免费视频 | 99热播精品 | 国产精品久久久久久福利一牛影视 | 精品欧美色视频网站在线观看 | 综合在线视频 | 亚洲成人免费在线观看 | 欧美在线一区二区三区 | 国产成人午夜精品影院游乐网 | 久久精品国产免费高清 | 日韩在线免费视频 | 亚洲精品自在在线观看 | 涩涩操|