成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

有這5款開源軟件,語音轉文字很簡單!

新聞 語音識別
語音文字轉換(STT)系統,一種能夠將語音單詞轉換成文本的方法,用途十分廣泛,比如我們經常在用的微信聊天中語音轉文字功能。

語音文字轉換(STT)系統,一種能夠將語音單詞轉換成文本的方法,用途十分廣泛,比如我們經常在用的微信聊天中語音轉文字功能。

過去,語音轉文本技術由專有軟件和庫控制;開源替代方案不存在或存在極端局限,如今這種形勢已經發生變化,今天你可以使用許多開源的語音轉文本工具和庫,今天,我們就舉5個好用的開源語音識別庫。

1、DeepSpeech項目 

[[285482]]

該項目由Mozilla開發,這是一個100%免費的開源語音轉文本庫,它使用了 TensorFlow 機器學習框架實現去功能。

你可以使用它自己構建訓練模型,以增強語音轉換到文本的效果,你還可以根據自己的需要引入其他語言,甚至可以輕松把它集成到TensorFlow上的其他機器學習項目中。唯一可惜的是,該項目目前默認情況下僅支持英語。

它也支持多種語言,例如Python(3.6)。運行十分簡單:

  1. pip3安裝deepspeech  
  2. deepspeech --model模型/output_graph.pbmm --alphabet模型/alphabet.txt --lm模型/lm.binary --trie模型/ trie --audio my_audio_file.wav  

你也可以使用npm安裝它:

  1. npm安裝deepspeech 

近日,DeepSpeech還登上Github Trending周榜:

有这5款开源软件,语音转文字很简单!

Github地址:https://github.com/mozilla/DeepSpeech

2、Kaldi

有这5款开源软件,语音转文字很简单!

Kaldi是用C++編寫的開源語音識別軟件,遵循Apache公共許可協議,支持Windows,macOS和Linux,2009年就已經發布了。

與其他語音識別軟件相比,Kaldi的主要功能是可擴展和模塊化。社區提供了大量的第三方模塊,Kaldi還支持深度神經網絡,并在其網站上提供了完整的使用文檔。

雖然代碼主要是用C++編寫的,但是它通過 Bash 和 Python 腳本進行了封裝。因此,如果你只是想實現基本的語音轉換成文本功能,那通過Python或Bash就可以輕松實現這一點。

項目主頁:http://kaldi-asr.org/

3、Julius

有这5款开源软件,语音转文字很简单! 

這可能是有史以來最古老的語音識別軟件之一;京都大學在1991年的時候開發的,然后于2005年將它移交給一個獨立的項目團隊。

Julius 的主要特點包括了執行實時 STT 的能力,低內存占用(20000 單詞少于 64 MB),能夠輸出最優詞N-best word和詞圖Word-graph,能夠作為服務器單元運行等等。這款軟件主要為學術和研究所設計。它是由C 語言寫成,并且可以運行在 Linux、Windows、macOS 甚至 Android(在智能手機上)。

目前,它僅支持英語和日語,該軟件可能很容易安裝在Linux發行版的倉庫中。只需在軟件包管理器中搜索julius包即可。

項目主頁:https://github.com/julius-speech/julius

4、Wav2Letter ++

有这5款开源软件,语音转文字很简单!

Wav2Letter ++是一款開源語音識別軟件,在今年由Facebook的AI研究團隊發布。該代碼在BSD許可下發布。Facebook將其倉庫描述為“當下最快、最先進的語音識別系統”,默認情況下,構建此工具所基于的概念使其針對性能進行了優化,Wav2Letter ++是基于FlashLight構建,它也是Facebook最新的機器學習庫。

使用Wav2Letter ++,你首先需要為你自己想要的語言構建訓練模型,以便于訓練算法,沒有任何一種語言(包括英語)的預訓練模型,它僅僅是個機器學習驅動的文本語音轉換工具,它用 C++ 寫成,因此被命名為 Wav2Letter++。

項目主頁:https://github.com/facebookresearch/wav2letter

5、DeepSpeech2

有这5款开源软件,语音转文字很简单!

百度的研究人員也在研究自己的語音轉文本引擎DeepSpeech2。這是一個端到端的開源引擎,它使用“ PaddlePaddle”深度學習框架將英語和普通話的語音轉換為文本。該項目在BSD許可下發布。

該引擎可以針對任何模型和所需的任何語言進行培訓。模型不隨代碼一起發布;就像其他軟件一樣,你必須自己構建它們。DeepSpeech2的源代碼是用Python編寫的;因此,如果這是你使用的語言,你應該很快就能使用上手

項目地址:https://github.com/PaddlePaddle/DeepSpeech

語音識別類別主要還是由專有軟件巨頭(例如Google和IBM)來主導(它們確實為此提供了自己的閉源商業服務),但是開源替代方案是有希望的。這5個開源語音識別引擎讓你可以自己著手構建應用程序,不知道有沒有你用過的呢? 

 

責任編輯:張燕妮 來源: 開源最前線
相關推薦

2019-06-24 09:30:00

開源技術 趨勢

2022-02-05 08:20:25

DeepSpeech開源軟件開發

2017-03-16 16:57:56

2024-11-29 07:45:38

C#離線語音文字

2015-12-30 10:36:59

2017-09-06 10:51:22

Facebook

2010-06-12 10:10:55

2010-09-13 17:04:21

防火墻故障

2014-12-30 09:35:16

文字轉語音

2010-10-09 16:51:47

2011-03-02 09:36:30

開源BBS論壇軟件

2020-11-17 08:58:32

開源工具報表

2011-03-01 09:10:19

開源數據庫

2010-06-10 12:55:18

MySQL5 mast

2010-09-29 14:48:16

2019-12-16 15:16:29

工具代碼開發

2010-06-09 13:55:24

設置MySQL同步

2010-05-19 16:45:26

MySQL自動啟動

2022-03-25 09:44:55

開源軟件
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 99re6在线| 二区中文字幕 | 久久国产精彩视频 | 国产一区二区三区在线 | 一区二区在线 | 男人的天堂视频网站 | 国产一区二区激情视频 | 九七午夜剧场福利写真 | 国产精品久久久久久一区二区三区 | 久久er99热精品一区二区 | 曰韩一二三区 | 精品欧美乱码久久久久久1区2区 | 日本高清视频网站 | 成人小视频在线免费观看 | 欧美日韩高清一区 | 天堂色区 | 久久久久亚洲 | 欧美午夜精品 | 好好的日在线视频 | 久久国产精品视频 | 国产免费av在线 | 成人精品系列 | 久久乐国产精品 | 久久久成人动漫 | 国产成人免费视频网站高清观看视频 | 午夜网站视频 | 久久久久久国产一区二区三区 | 日本一道本视频 | 鸳鸯谱在线观看高清 | 日韩中文一区二区三区 | 亚洲国产日韩一区 | 男人视频网站 | 久久久美女 | 欧美日一区| www久久久| 99热精品在线观看 | 亚洲精品2区 | 国产xxxx搡xxxxx搡麻豆 | 免费日韩av网站 | 国产露脸国语对白在线 | 国产一区二区三区免费 |