成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

純PyTorch語音工具包開源,Kaldi:我壓力有點大

新聞 開發工具
距離 Mirco Ravanelli 宣布打造新的語音工具包過去了一年多,SpeechBrain 真的如期而至。

  距離 Mirco Ravanelli 宣布打造新的語音工具包過去了一年多,SpeechBrain 真的如期而至。

純PyTorch語音工具包開源,Kaldi:我壓力有點大

語音處理技術的進步,是人工智能改變大眾的生活的重要一環。深度學習技術的興起,也讓這一領域近年來得到了長足的發展。在過往,該領域的主要方法是為不同的任務開發不同的工具包,對于使用者來說,學習各個工具包需要大量時間,還可能涉及到學習不同的編程語言,熟悉不同的代碼風格和標準等。現在,這些任務大多可以用深度學習技術來實現。

此前,開發者常用的語音工具有 Kaldi、ESPNet、CMU Sphinx、HTK 等,它們各有各的不足之處。以 Kaldi 為例,它依賴大量的腳本語言,而且核心算法使用 C++ 編寫,再加上可能需要改變各種神經網絡的結構。即便是擁有豐富經驗的工程師,在調試的時候也會經歷巨大的痛苦。

秉承著讓語音開發者更輕松的原則,Yoshua Bengio 團隊成員 Mirco Ravanelli 等人曾經開發了一個試圖繼承 Kaldi 的效率和 PyTorch 的靈活性的開源框架——PyTorch-Kaldi,但據開發成員本人認為「還不夠完善」。

所以,在一年多前, Mirco Ravanelli 宣布要打造一款新的一體化語音工具包 SpeechBrain。該項目于近日正式開源,鑒于上述背景,SpeechBrain 誕生的主要宗旨是:夠簡單、夠靈活、對用戶友好。

純PyTorch語音工具包開源,Kaldi:我壓力有點大

項目地址:https://github.com/speechbrain/speechbrain

作為一個基于 PyTorch 的開源一體化語音工具包,SpeechBrain 可用于開發最新的語音技術,包括語音識別、說話者識別、語音增強、多麥克風信號處理和語音識別系統等,且擁有相當出色的性能。團隊將其特征概況為「易于使用」、「易于定制」、「靈活」、「模塊化」等。

對于機器學習研究者來說,SpeechBrain 可輕松嵌入其他模型,促進語音技術的相關研究;對于初學者來說,SpeechBrain 也不難掌握,根據測試,一般開發者僅需要幾個小時就能熟悉該工具包的使用。此外,開發團隊也發布了很多教程以供參考(https://speechbrain.github.io/tutorial_basics.html)。

總體來說,SpeechBrain 有以下幾大亮點:

  • 開發團隊與 HuggingFace 集成一些預訓練模型,這些模型具備可運行推理的接口。如果 HuggingFace 模型不可用,團隊會提供一個 Google Drive 文件夾,包含所有對應的實驗結果;
  • 使用 PyTorch 數據并行或分布式數據并行來進行多 GPU 訓練和推理;
  • 混合精度,加快訓練速度;
  • 透明且完全可自定義的數據輸入和輸出 pipeline。SpeechBrain 遵循 PyTorch 數據加載器和數據集樣式,使用戶能夠自定義 I / O pipeline。

快速安裝

目前開發者可以通過 PyPI 安裝 SpeechBrain,此外還可以使用本地安裝來運行實驗和修改 / 自定義工具包。

SpeechBrain 支持基于 Linux 的發行版和 macOS(且針對 Windows 用戶也提供了相應解決方案:https://github.com/speechbrain/speechbrain/issues/512)。
SpeechBrain 支持 CPU 和 GPU,但對于大多數 recipe 而言,訓練期間必須使用 GPU。需要注意的是,必須正確安裝 CUDA 才能使用 GPU。

安裝教程地址:https://speechbrain.readthedocs.io/en/latest/installation.html

通過 PyPI 安裝

創建 Python 環境后,只需輸入以下內容即可:

  1. pip install speechbrain 

然后可以使用以下命令訪問 SpeechBrain:

  1. import  speech  brain  as  sb 

本地安裝

創建 Python 環境后,只需輸入以下內容即可:

  1. git clone https://github.com/speechbrain/speechbrain.gitcd speechbrainpip install -r requirements.txtpip install --editable . 

然后可以通過以下方式訪問 SpeechBrain:

  1. import  speechbrain  as  sb 

對 speechbrain 軟件包所做的任何修改,將在安裝帶有 --editable 標志的軟件包時自動解釋。

SpeechBrain 未附屬于任何機構,團隊成員來自 Mila 研究所、Nuance、杜比實驗室、英偉達、三星、Viadialog 等實驗室和企業單位。最初的兩位負責人是 Mila 研究所博士后 Mirco Ravanelli 和 Avignon 博士生 Titouan Parcollet。目前,Speechbrain 項目還在完善中,也歡迎更多開發人員加入。

看到這里,Kaldi 會不會感到壓力有點大了呢?

 

 

責任編輯:張燕妮 來源: 機器之心Pro
相關推薦

2017-06-26 15:15:24

開源語音識別工具包

2016-01-27 13:34:07

開源語音識別CNTK

2018-12-27 10:52:10

Facebook 開發開源

2016-02-16 13:21:33

2023-02-15 08:26:29

iOS工具

2019-05-13 09:22:21

微軟開源機器學習

2012-02-06 09:13:40

開源工具包管理系統

2009-04-02 17:37:38

dom4jXMLJava

2018-05-03 09:03:16

微軟工具包Windows

2022-04-09 10:02:59

HTTPLInux開源

2014-08-01 10:41:34

間諜工具NSA間諜軟件

2015-11-11 14:01:26

微軟開源分布式

2022-06-19 14:09:04

開源AdobeCAI

2021-01-25 21:01:42

開源技術 工具

2020-02-10 16:07:42

工具包

2011-04-18 09:46:58

Windows工具包活動目錄MPS報告

2009-09-16 08:34:17

Windows Emb

2009-04-03 11:12:43

PalmwebOS開發

2024-06-18 12:26:50

2025-02-07 15:00:00

語音識別算法AI
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久男人 | 欧美黄在线观看 | 亚洲精品一级 | 国产精品久久久久久中文字 | 人人看人人射 | 黄色片在线| 国产精品美女 | 久久国产一区二区 | 亚洲精品福利视频 | 免费中文字幕日韩欧美 | 日日操操 | 久久专区 | 国产一区二区麻豆 | 日本在线视频一区二区 | 欧美在线视频一区二区 | 国产精品免费看 | 欧美13videosex性极品 | 亚洲精品乱| 亚洲精品一区二区三区四区高清 | 成人网av | 久久久久久久综合色一本 | 精品美女在线观看 | 欧美日韩亚洲视频 | 国产日韩欧美在线播放 | 国产一二三区免费视频 | 日韩午夜影院 | 天堂影院av | 99精品视频在线 | 欧美电影网 | 久久久国产精品入口麻豆 | 国产精品久久久久久久7777 | 午夜精品一区 | 国产乱人伦精品一区二区 | 国产日韩精品在线 | wwwsihu| 91原创视频 | 美女黄视频网站 | 男女网站视频 | 久久一及片 | 欧美一级视频免费看 | 欧美日韩黄色一级片 |