百度發布DeepVoice最終版：模仿萬人、半小時學會一種口音

作者：佚名 2017-10-25 09:51:08

搜索巨頭百度推出了一個名叫 DeepVoice 的全新人工智能系統，借助熱門的深度學習技術，它能夠實現文本到語音（TTS）的轉換。

今年早些時候，搜索巨頭百度推出了一個名叫 DeepVoice 的全新人工智能系統，借助熱門的深度學習技術，它能夠實現文本到語音（TTS）的轉換。初版 DeepVoice 可以產生較短的語句，不仔細聽還以為是個真人在說話。該系統還可以每次學習一種聲音，在數小時后即可掌握。而今年 5 月份推出 DeepVoice 2，可以在一小時內模仿出一種口音，單系統就可以學習數百種不同的口音。

現在，百度推出了 DeepVoice 的“最終版”，聲稱可以在每半個小時內完成對 10000 種語音的數據學習。這種高效生成各種各樣聲音的技術，為許多用例打開了大門。

例如，在有聲書或視頻游戲中，每個角色都可以有自己獨特的聲音，以獲得更強的用戶體驗。不過與真人配音相比，百度 DeepVoice 產出的口音，其合成感還是很明顯的。

對此，百度表示這并不是他們的目標：“如果只生成一兩種口音的話，我們的系統早已證實能夠合成相當自然的、接近真人的口音，且可以輕易將它用作數字助理”。

Deep Voice 3 架構圖

百度所要嘗試的，是制造出一種能夠掌握多種口音或字符間細微差別的系統：

這只是最初的工作，展示了可伸縮的可能性。我們的系統成功地量訓練擴大了一個規模，此前發表的 TTS 模型中尚未達到過。

我們相信，通過使用大型高質量數據集、和額外的機器學習工程訓練，其質量可在不久的將來大幅提升。

需要指出的是，百度并不是唯一一家從事計算機語音合成工作的搜索巨頭，Google 旗下的 DeepMind 部門也一直在進行一個名叫 WaveNet 的類似項目。

在最新的版本中，WaveNet 已經能夠在掌握口音方面做到更好，甚至像真人那樣產生“唇音”。現在，它已經被用到了英語和日語版本的 Google Assistant 上。

[編譯自：TheVerge , 來源：百度研究院]

責任編輯：張燕妮來源： cnBeta

百度

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

百度發布DeepVoice最終版：模仿萬人、半小時學會一種口音