成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

一個開源庫搞定各類文本到音頻生成,Meta發布AudioCraft

人工智能 新聞
為了高質量地生成各類音頻,AudioCraft 包含三個模型:MusicGen、AudioGen 和 EnCodec。其中,MusicGen 使用 Meta 具有版權的音樂數據進行訓練,基于用戶輸入的文本生成音樂。

近來,Meta 發布并開源了多個 AI 模型,例如 Llama 系列模型、分割一切的 SAM 模型。這些模型推動了開源社區的研究進展。現在,Meta 又開源了一個能夠生成各種音頻的 PyTorch 庫 ——AudioCraft,并公開了其技術細節。

圖片


  • 代碼地址:https://github.com/facebookresearch/audiocraft
  • 項目主頁:

https://audiocraft.metademolab.com/?utm_source=twitter&utm_medium=organic_social&utm_campaign=audiocraft&utm_cnotallow=card

AudioCraft 能夠基于用戶輸入的文本生成高質量、高保真的音頻。我們先來聽一下生成效果。

AudioCraft 可以生成一些現實場景中的聲音,例如輸入文本 prompt:「Whistling with wind blowing(風呼嘯而過)」

語音1,機器之心,5秒

還能生成有旋律的音樂,例如輸入文本 prompt:「Pop dance track with catchy melodies, tropical percussions, and upbeat rhythms, perfect for the beach(流行舞曲,具有朗朗上口的旋律、熱帶打擊樂和歡快的節奏,非常適合海灘)」

語音2,機器之心,30秒

甚至還可以選擇具體的樂器,生成特定的音樂,例如輸入文本輸入文本 prompt:「Earthy tones, environmentally conscious, ukulele-infused, harmonic, breezy, easygoing, organic instrumentation, gentle grooves(樸實的曲調,環保理念,尤克里里,和聲,輕松,隨和,有機樂器,柔和的節奏)」

語音3,機器之心,30秒

AudioCraft 簡介

相比于文本、圖像,音頻生成是更具挑戰性的,因為生成高保真音頻需要對復雜的信號和模式進行建模。

為了高質量地生成各類音頻,AudioCraft 包含三個模型:MusicGen、AudioGen 和 EnCodec。其中,MusicGen 使用 Meta 具有版權的音樂數據進行訓練,基于用戶輸入的文本生成音樂;AudioGen 使用公共音效數據進行訓練,基于用戶輸入的文本生成音頻;EnCodec 用于壓縮音頻并以高保真度重建原始信號,保證生成的音樂是高質量的。

圖片

從原始音頻信號生成音頻需要對極長的序列進行建模。例如,以 44.1 kHz 采樣的幾分鐘音樂曲目由數百萬個時間步(timestep)組成。相比之下,Llama 和 Llama 2 等基于文本的生成模型是將文本處理成子詞,每個樣本僅需要幾千個時間步。

MusicGen 是專門為音樂生成量身定制的音頻生成模型。音樂曲目比環境聲音更復雜,在創建新的音樂作品時,在長程(long-term)結構上生成連貫的樣本非常重要。MusicGen 在大約 400000 個錄音以及文本描述和元數據上進行訓練,總計 20000 小時的音樂。

AudioGen 模型可以生成環境聲音及聲效,例如狗叫聲、汽車喇叭聲或腳步聲。

圖片

AudioGen 模型架構。

EnCodec 神經音頻編解碼器從原始信號中學習離散音頻 token,這相當于給音樂樣本提供了新的固定「詞匯」;然后研究團隊又在這些離散的音頻 token 上訓練自回歸語言模型,以在使用 EnCodec 的解碼器將 token 轉換回音頻空間時生成新的 token、聲音和音樂。

總的來說,AudioCraft 簡化了音頻生成模型的整體設計。MusicGen 和 AudioGen 均由單個自回歸語言模型組成,并在壓縮的離散音樂表征流(即 token)上運行。AudioCraft讓用戶可以使用不同類型的條件模型來控制生成,例如使用預訓練的文本編碼器完成文本到音頻生成。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-08-03 07:24:40

MetaAI 語言模型

2023-08-04 17:33:27

Meta音頻AI

2024-02-07 12:37:23

模型數據

2023-02-13 13:58:15

模型開源

2023-04-03 10:04:44

開源模型

2025-06-11 09:12:00

視頻生成AI

2012-07-30 09:40:52

Lua

2023-11-28 14:22:54

Python音頻

2025-06-18 16:42:15

視頻生成AI模型

2024-12-04 11:07:09

2012-07-17 17:05:55

JavaScript

2022-05-26 10:42:30

數據權限注解

2023-04-23 13:32:28

MetaAI開源

2022-02-15 15:38:02

人工智能機器學習Meta

2022-06-14 10:47:27

項目日志PUT

2025-03-03 08:32:00

模型AI訓練

2024-05-28 07:06:44

2023-10-10 08:22:12

Tesseract庫開源

2024-12-09 17:32:37

2023-05-10 07:07:23

開源人工智能
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91秦先生艺校小琴 | 一区二区三区久久久 | 国产亚洲精品久久19p | 暴草美女 | 欧美亚洲国产日韩 | 欧美一级全黄 | 91久久久久 | 2020亚洲天堂 | 欧美一级久久精品 | 日韩www| 亚洲精品视频在线观看免费 | 一区影视 | 国产一区免费 | 久久久精品一区二区三区四季av | 久久久一区二区三区 | 亚洲综合一区二区三区 | 91av在线视频观看 | 久久久久久91 | 国产视频在线观看一区二区三区 | 18gay男同69亚洲网站 | 91亚洲欧美 | 午夜精品一区二区三区免费视频 | 中文久久 | 久久久精品一区二区三区四季av | 99re热精品视频 | 欧美日高清视频 | 亚洲精品视频在线看 | 99精品电影| 精品国产一区二区三区久久久久久 | 日韩免费在线视频 | 在线国产视频 | 国产精品视频网 | 日韩精品一二三 | 中文字幕av一区二区三区 | 亚洲一区二区三区四区视频 | 亚洲精品在线免费 | 国产欧美在线 | 午夜激情在线 | 一区二区三区四区国产 | 国产一区二区三区在线视频 | 亚洲欧美少妇 |