成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

小紅書語音識別新突破!開源FireRedASR,中文效果新SOTA

人工智能 新聞
近日,小紅書 FireRed 團隊正式發布并開源了基于大模型的語音識別模型 ——FireRedASR,在語音識別領域帶來新突破。

語音識別(ASR,Automatic Speech Recognition)是一種將語音轉化為文字的技術,被廣泛應用于智能語音交互和多媒體內容理解領域,例如語音助手、語音輸入、視頻字幕等場景。衡量中文 ASR 性能的主要指標是字錯誤率(CER,Character Error Rate),該值越低,表示模型的識別效果越好。

近日,小紅書 FireRed 團隊正式發布并開源了基于大模型的語音識別模型 ——FireRedASR,在語音識別領域帶來新突破。在業界廣泛采用的中文普通話公開測試集上,FireRedASR 憑借卓越的性能取得了新 SOTA!FireRedASR 在字錯誤率(CER)這一核心技術指標上,對比此前的 SOTA Seed-ASR,錯誤率相對降低 8.4%,充分體現了團隊在語音識別技術領域的創新能力與技術突破。

  • 論文標題:FireRedASR: Open-Source Industrial-Grade Mandarin Speech Recognition Models from Encoder-Decoder to LLM Integration
  • 論文地址:http://arxiv.org/abs/2501.14350
  • 項目地址:https://github.com/FireRedTeam/FireRedASR

FireRedASR 介紹

FireRedASR 系列模型包含兩種核心結構:FireRedASR-LLM 和 FireRedASR-AED,分別針對語音識別的極致精度和高效推理需求量身打造。團隊開源了不同規模的模型和推理代碼,旨在滿足全面覆蓋多樣化的應用場景。

FireRedASR-LLM 和 FireRedASR-AED 的結構如下圖所示: 

  • FireRedASR-LLM(左):結合了文本預訓練 LLM 的能力,為極致的 ASR 準確率而生,適用于對準確率要求極高的應用場景。
  • FireRedASR-AED(右下):基于經典的 Attention-based Encoder-Decoder 架構,FireRedASR-AED 通過擴展參數至 1.1B,成功平衡了 ASR 語音識別的高準確率與推理效率。

實驗及結果

下圖是 FireRedASR 和其他 ASR 大模型的對比,在業界常用的中文普通話公開測試集上,FireRedASR-LLM(8.3B 參數量)取得了最優 CER 3.05%、成為新 SOTA!FireRedASR-AED (1.1B 參數量)緊隨其后取得 3.18%,兩者均比 Seed-ASR(12+B 參數量)的 3.33% 低、并且參數量更小。FireRedASR 也比 Qwen-Audio、SenseVoice、Whisper、Paraformer 取得了更優的 CER。

(aishell1 表示 AISHELL-1 測試集,aishell2 表示 AISHELL-2 iOS 測試集,ws_net 和 ws_meeting 分別表示 WenetSpeech 的 Internet 和 Meeting 測試集)

FireRedASR 不僅在公開測試集上表現優異,在多種日常場景下,也展現了卓越的語音識別效果。

如下圖所示,在由短視頻、直播、語音輸入和智能助手等多種來源組成的 Speech 測試集上,與業內領先的 ASR 服務提供商(ProviderA)和 Paraformer-Large 相比, FireRedASR-LLM 的 CER 相對降低 23.7%~40.0%,優勢十分明顯。

值得一提的是,在需要歌詞識別能力的場景中,FireRedASR-LLM 也表現出極強的適配能力,CER 實現了 50.2%~66.7% 的相對降低,這一成果進一步拓寬了 FireRedASR 的應用范圍,使其不僅能勝任傳統語音識別需求,還能在創新性的多媒體場景中大放異彩。

值得一提的是,FireRedASR 在中文方言和英語場景中同樣表現不俗。在 KeSpeech(中文方言)和 LibriSpeech(英語)測試集上,FireRedASR 的 CER 顯著優于此前的開源 SOTA 模型,使其在支持好普通話 ASR 的前提下,在中文方言和英語上也足夠通用,進一步凸顯了其魯棒的語言適配能力。

好奇為什么 FireRedASR 能取得如此好的效果嗎?可以參考 FireRed 團隊公開的技術報告一探究竟,并且模型和代碼已經全部開源(鏈接見上文)。

FireRed 團隊希望通過開源能為語音社區做出貢獻,促進 ASR 的應用和端到端語音交互的發展。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2019-11-15 11:17:37

ASRU2019

2025-02-17 07:00:00

蘋果模型

2024-08-19 08:45:00

開源模型

2010-05-19 15:23:51

Linux 2.6.3Ceph分布式文件系統

2025-06-17 09:07:24

2024-10-12 10:57:39

2011-11-25 15:01:26

LFR交換機大型二層網絡

2022-02-16 22:09:24

WiFi 7WiFi技術

2022-11-03 16:31:08

語音智能語音識別

2025-02-25 10:04:10

2024-12-26 11:48:27

2025-03-04 09:00:00

2020-02-25 17:30:12

谷歌Android開發者

2024-05-27 12:17:58

AI目標檢測

2023-09-12 11:30:44

自動駕駛技術

2025-06-20 14:37:59

模型AI圖像生成

2023-09-25 14:53:55

3D檢測

2012-02-01 09:36:00

2023-12-23 23:35:13

語言視覺
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品一二区 | 亚洲国产精品久久久久婷婷老年 | 日韩三区在线观看 | 日韩高清在线观看 | 日韩中文字幕一区二区 | 国产精品日日夜夜 | 久久久久黄 | 亚洲第一区国产精品 | 久久精品欧美一区二区三区麻豆 | 欧美精品一区二区三区在线播放 | 国产91av视频在线观看 | 国产成人jvid在线播放 | 一区二区影院 | 日韩av免费在线观看 | 精品国产乱码久久久久久老虎 | 国产高清精品在线 | 久久99精品久久久久久噜噜 | 午夜99| 日韩在线一区二区三区 | 久久99精品久久久久久狂牛 | 国产一区二区三区在线 | 91久久精品日日躁夜夜躁国产 | 国产黄色av网站 | 精久久久| 国产东北一级毛片 | 亚洲一区二区三区在线播放 | www.久久影视 | 国产综合精品一区二区三区 | 在线观看欧美一区 | 日韩天堂av| 欧美区在线 | 国产成人99久久亚洲综合精品 | 精品少妇一区二区三区日产乱码 | 久国久产久精永久网页 | 99精品亚洲国产精品久久不卡 | 国产精品成av人在线视午夜片 | 日韩精品在线一区 | 一区二区三区免费 | 全免费a级毛片免费看视频免费下 | 在线午夜| 国产精品视频在线观看 |