成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

能聽懂語音的ChatGPT來了:10小時錄音扔進去,想問什么問什么

人工智能 新聞
類 ChatGPT 模型的輸入框里可以粘貼語音文檔了。

大型語言模型(LLM)正在改變每個行業的用戶期望。然而,建立以人類語音為中心的生成式人工智能產品仍然很困難,因為音頻文件對大型語言模型構成了挑戰。


將 LLM 應用于音頻文件的一個關鍵挑戰是,LLM 受其上下文窗口的限制。在一個音頻文件能夠被送入 LLM 之前,它需要被轉換成文本。音頻文件越長,繞過 LLM 的上下文窗口限制的工程挑戰就越大。但工作場景中,我們往往需要 LLM 幫我們處理非常長的語音文件,比如從一段幾個小時的會議錄音中抽取核心內容、從一段訪談中找到某個問題的答案……

最近,語音識別 AI 公司 AssemblyAI 推出了一個名為 LeMUR 的新模型。就像 ChatGPT 處理幾十頁的 PDF 文本一樣,LeMUR 可以將長達 10 小時的錄音進行轉錄、處理,然后幫用戶總結語音中的核心內容,并回答用戶輸入的問題。

圖片

試用地址:https://www.assemblyai.com/playground/v2/source

LeMUR 是 Leveraging Large Language Models to Understand Recognized Speech(利用大型語言模型來理解識別的語音)的縮寫,是將強大的 LLM 應用于轉錄的語音的新框架。只需一行代碼(通過 AssemblyAI 的 Python SDK),LeMUR 就能快速處理長達 10 小時的音頻內容的轉錄,有效地將其轉化為約 15 萬個 token。相比之下,現成的、普通的 LLM 只能在其上下文窗口的限制范圍內容納最多 8K 或約 45 分鐘的轉錄音頻。

圖片

為了降低將 LLM 應用于轉錄音頻文件的復雜性,LeMUR 的 pipeline 主要包含智能分割、一個快速矢量數據庫和若干推理步驟(如思維鏈提示和自我評估),如下圖所示:

圖片

圖 1:LeMUR 的架構使用戶能夠通過一個 API 調用將長的和 / 或多個音頻轉錄文件發送到 LLM 中。

未來,LeMUR 有望在客服等領域得到廣泛應用。

圖片

LeMUR 解鎖了一些驚人的新可能性,在幾年前,我認為這些都是不可能的。它能夠毫不費力地提取有價值的見解,如確定最佳行動,辨別銷售、預約或呼叫目的等呼叫結果,感覺真的很神奇。—— 電話跟蹤和分析服務技術公司 CallRail 首席產品官 Ryan Johnson

LeMUR 解鎖了什么可能性?

將 LLM 應用于多個音頻文本

LeMUR 能夠讓用戶一次性獲得 LLM 對多個音頻文件的處理反饋,以及長達 10 小時的語音轉錄結果,轉化后的文本 token 長度可達 150K 。

圖片

可靠、安全的輸出

由于 LeMUR 包含安全措施和內容過濾器,它將為用戶提供來自 LLM 的回應,這些回應不太可能產生有害或有偏見的語言。

圖片

可補充上下文

在推理時,它允許加入額外的上下文信息,LLM 可以利用這些額外信息在生成輸出時提供個性化和更準確的結果。

圖片

模塊化、快速集成

LeMUR 始終以可處理的 JSON 形式返回結構化數據。用戶可以進一步定制 LeMUR 的輸出格式,以確保 LLM 給出的響應是他們下一塊業務邏輯所期望的格式(例如將回答轉化為布爾值)。在這一流程中,用戶不再需要編寫特定的代碼來處理 LLM 的輸出結果。

試用結果

根據 AssemblyAI 提供的測試鏈接,機器之心對 LeMUR 進行了測試。

LeMUR 的界面支持兩種文件輸入方式:上傳音視頻文件或粘貼網頁鏈接均可。

圖片

我們用 Hinton 近期的一份訪談資料作為輸入,測試 LeMUR 的性能。

圖片

上傳之后,系統提示我們要等一段時間,因為它要先把語音轉成文字。

圖片

轉錄之后的界面如下:

圖片

在頁面右側,我們可以要求 LeMUR 總結采訪內容或回答問題。LeMUR 基本可以輕松地完成任務:

圖片

圖片

如果要處理的語音是一段演講或客服回復,你還能向 LeMUR 征求改進建議。

圖片

不過,LeMUR 似乎目前還不支持中文。感興趣的讀者可以去嘗試一下。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2021-03-19 06:08:09

智慧城市物聯網城市服務

2016-08-04 16:30:49

華為

2022-10-20 08:51:40

跳表復雜度索引

2019-07-12 12:57:43

人工智能垃圾分類智能垃圾桶

2023-05-19 07:35:03

ChatGPTOpenAI

2015-10-13 10:14:27

HR問題面試

2022-05-18 18:31:28

機器人自然語言編程

2022-01-23 16:13:06

比特幣加密貨幣暴跌

2019-07-01 05:02:34

IP地址子網掩碼 網關

2013-01-16 16:05:49

語義云App自然語言

2021-09-05 23:54:55

人工智能機器語言

2019-02-27 10:18:26

重置Windows 10Windows

2023-05-14 23:39:51

機器人深度學習

2022-11-14 21:34:17

2015-05-07 14:58:06

編程每周工作80小時

2016-01-18 10:06:05

編程

2012-03-07 10:05:12

2023-03-05 19:30:02

人工智能ChatGPT

2017-09-05 08:14:09

深度學習語音合成

2023-03-22 18:17:41

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 超碰av在线 | 成人性生交a做片 | 精品国产一区三区 | 久99久视频 | 亚洲 欧美 另类 综合 偷拍 | 婷婷色在线 | 亚洲精品国产区 | 国产伊人精品 | 高清成人免费视频 | 国产高清视频 | 精品一二三区在线观看 | 日韩高清国产一区在线 | 中文字幕乱码视频32 | 亚洲国产精品久久久久秋霞不卡 | 久久久国产精品一区 | 日韩精品一区二区三区中文在线 | 综合久久久久 | 国产a一区二区 | 精品亚洲一区二区三区 | 久久精品欧美一区二区三区不卡 | 超碰地址 | 午夜看片网站 | 日韩精品视频在线 | 国产在线一区二区三区 | 99精品免费视频 | 久久com| 国产精品色婷婷久久58 | 日韩视频精品 | 欧美午夜在线 | 91精品国产欧美一区二区 | 亚洲精品乱码久久久久久蜜桃91 | 91免费在线 | 97色在线视频 | 日韩综合| 久久国产精品99久久久大便 | 少妇一区二区三区 | 色婷婷在线视频 | 欧美色视频免费 | 国产精品色 | www.日韩高清 | 午夜激情国产 |