成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

谷歌AI播客剛火,Meta就開源了平替,效果一言難盡

人工智能 新聞
隨著谷歌和 Meta 相繼推出基于大語言模型的 AI 播客功能,將極大地豐富人類用戶與 AI 智能體互動的體驗。

上個月,谷歌宣布對旗下 AI 筆記應用 NotebookLM 進行一系列更新,允許用戶生成 YouTube 視頻和音頻文件的摘要,甚至可以創建可共享的 AI 生成音頻討論。加上此前支持的谷歌文檔、PDF、文本文件、谷歌幻燈片和網頁,NotebookLM 的用例和覆蓋范圍進一步擴大。

本月初,AI 大牛 Karpathy 發推表示自己只用了兩個小時就創建了一個 10 集的系列博客 —— 歷史謎團(Histories of Mysteries),其中就使用 NotebookLM 將每個主題的維基百科條目鏈接在一起,并生成播客視頻;同時也使用 NotebookLM 編寫博客 / 劇集描述。

圖片

就這兩天,Meta 推出了 NotebookLM 的開源平替版 ——NotebookLlama,它使用 Llama 模型進行大部分任務處理,包括 Llama-3.2-1B-Instruct、Llama-3.1-70B-Instruct 和 Llama-3.1-8B-Instruct。

下圖為 NotebookLlama 運行流程,首先從文件(比如新聞文章或博客文章)創建轉錄文本,然后添加「更多戲劇化」和中斷,最后將轉錄文本饋入到開放的文本到語音模型。

圖片

據外媒 Techcrunch 報道,NotebookLlama 的效果聽起來不如谷歌 NotebookLM 好,帶有明顯的機器人口音,并且往往會在奇怪的時刻「互相交談」。不過,項目背后的 Meta 研究人員表示,使用更強大的模型還可以提高質量。

Meta 研究人員在 NotebookLlama 的 GitHub 頁面寫到,「文本到語音模型限制了聲音的自然程度。」此外,編寫播客的另一種方法是讓兩個智能體就感興趣的主題進行討論并編寫播客大綱。現在,Meta 只使用了一個模型來編寫播客大綱。

就像下面所展示的,雖然播客內容還有一些粗糙,但它聽起來已經很不錯了。

對于 Meta 的 NotebookLlama,有人直言聽起來糟糕透了,要想真正地對標谷歌的 NotebookLM,就要在語音轉換效果上接近人類水平。不過也有人認為,雖然目前效果不佳,但隨著所有代碼的開源,用戶可以自定義嘗試不同的提示方法等,相信未來會變得更好。

圖片

雖然效果還是差點意思,但也有網友表示:「現在是時候讓 Google 加快步伐了,Meta 已經緊隨其后趕上來了,開源 NotebookLM。」

圖片

項目介紹

根據 Meta 發布的教程配方,你可以基于 PDF 文件構建播客。

圖片

項目地址:https://github.com/meta-llama/llama-recipes/tree/main/recipes/quickstart/NotebookLlama

  • 第一步:對 PDF 進行預處理。即使用 Llama-3.2-1B-Instruct 對 PDF 進行預處理,并將其保存為.txt 文件;
  • 第二步:轉錄文本編寫器。使用 Llama-3.1-70B-Instruct 模型從文本中編寫播客轉錄文本;
  • 第三步:對內容重新優化,添加戲劇性。使用 Llama-3.1-8B-Instruct 模型使轉錄文本更具有創意;
  • 第四步:文本到語音。使用 parer -tts/parer -tts-mini-v1(文本到語音模型)和 bark/suno 生成會話播客。

不過,還有幾個值得大家注意的點:

首先,在步驟 1 中,需要提示 1B 模型不要修改文本或對文本進行總結,并嚴格清理掉可能在 PDF 轉錄過程中出現的多余字符或垃圾字符。

其次,對于步驟 2,你也可以使用 Llama-3.1-8B-Instruct 模型,然后對比不同模型的效果。項目中采用的是 70B 模型,原因在于它為測試示例提供了更具創意的播客記錄。

對于步驟 4,你也可以使用其他模型進行擴展,較新的模型可能聽起來更好。

想要順暢的運行該項目,你需要有 GPU 服務器或者使用 70B、8B 和 1B Llama 模型的 API 提供商。如果你采用的是 70B 模型,那么需要一個總內存約為 140GB 的 GPU 來以 bfloat-16 精度進行推理。

退一步講,如果你的 GPU 并不是很好,也可以使用 8B 模型跑通整個 pipeline。

接下來是安裝。在開始之前,請確保使用 huggingface cli 登錄,然后啟動 jupyter notebook ,以確保能夠下載 Llama 模型。

接著運行代碼:

git clone https://github.com/meta-llama/llama-recipes
cd llama-recipes/recipes/quickstart/NotebookLlama/
pip install -r requirements.txt

Notebook 1:Notebook 1 用于處理 PDF,并使用新的 Feather light 模型將其處理為.txt 文件。

Notebook 2:Notebook 2 將接收 Notebook 1 處理后的輸出,并使用 Llama-3.1-70B-Instruct 模型創造性地將其轉換為播客腳本。如果你擁有豐富的 GPU 資源,也可以使用 405B 模型進行測試!

Notebook 3:Notebook 3 采用了之前的文本,并提示 Llama-3.1-8B-Instruct 在對話中添加更多的戲劇化和中斷。

Notebook 4:最后,Notebook 4 從上一個 notebook 中獲取結果并將其轉換為播客。項目中使用了 parer -tts/parer - ttts -mini-v1 和 bark/suno 模型進行對話。

這里有一個問題:Parler 需要 4.43.3 或更早版本的 transformer,但對于 pipeline 中的步驟 1 到 3,需要最新的版本,所以需要在最后一個 notebook 中切換版本。

最后,項目列出了未來需要改進的地方:

  • 語音模型:TTS 模型使語音聽起來不是很自然,未來可以納入更好的模型;
  • 更好的提示;
  • 支持提取網站、音頻文件、YouTube 鏈接等。
責任編輯:張燕妮 來源: 機器之心
相關推薦

2018-11-07 19:46:30

本地ERP

2022-08-31 08:14:46

算法key鏈表

2020-05-25 09:45:47

開發技能代碼

2024-11-25 10:30:00

AI視頻開源

2023-03-20 18:55:10

微軟AI人工智能

2020-12-18 06:01:02

容器鏡像軟件

2022-11-28 08:20:54

重構組件系統

2021-05-18 11:40:11

開源腳本工具

2023-02-15 08:18:58

AI工具

2019-09-09 09:29:27

互聯網程序員職業

2023-03-13 12:32:45

ChatGPT開源

2024-11-20 09:27:06

2016-10-28 13:14:25

2009-12-01 18:41:08

SUSE Linux

2015-11-13 10:45:48

ASP.NET開發者

2023-04-02 21:39:14

ChatGPT開源

2022-09-02 09:14:10

監控系統

2023-07-13 15:10:06

2022-10-13 11:59:11

AI

2021-01-12 15:58:03

云管理
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩视频中文字幕 | 精品中文字幕视频 | 毛片国产| 欧美日韩精品在线一区 | 成人免费影院 | 亚洲国产精品久久人人爱 | 日韩高清av | 欧美日韩中文字幕 | 一区二区三区小视频 | 色综合久久天天综合网 | 91免费观看国产 | 欧美视频在线观看 | h视频在线观看免费 | 激情久久久久 | 国产91在线播放 | 少妇精品久久久久久久久久 | 国产在线一区二区 | 日韩视频免费看 | 久热久草 | 在线一区二区观看 | 精品视频一二区 | 久久久久国产一区二区三区四区 | 亚洲福利免费 | www.日本国产 | 日韩电影中文字幕 | 久热精品在线观看视频 | 亚洲视频欧美视频 | 99久视频| 久久久国产精品入口麻豆 | 天堂成人国产精品一区 | 亚洲国产一区二区三区在线观看 | 99精品欧美一区二区三区综合在线 | 在线一区视频 | 国产精品美女久久久久久不卡 | 欧美日韩在线一区二区 | 国产中文视频 | 久久久久国产一区二区三区 | 久久久久久亚洲欧洲 | 久久久久久国产一区二区三区 | 人人玩人人添人人澡欧美 | 欧美日韩在线电影 |