成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

蘋果機(jī)器學(xué)習(xí)期刊「Siri 三部曲」之一:通過跨帶寬和跨語言初始化提升神經(jīng)網(wǎng)絡(luò)聲學(xué)模型

新聞 移動(dòng)開發(fā)
近日,蘋果 Siri 團(tuán)隊(duì)在蘋果機(jī)器學(xué)習(xí)期刊上連發(fā)三文,詳實(shí)展現(xiàn)了蘋果在語音助手 Siri 上的最新進(jìn)展與成果。

近日,蘋果 Siri 團(tuán)隊(duì)在蘋果機(jī)器學(xué)習(xí)期刊上連發(fā)三文《Improving Neural Network Acoustic Models by Cross-bandwidth and Cross-lingual Initialization》、《Inverse Text Normalization as a Labeling Problem》、《Deep Learning for Siri』s Voice: On-device Deep Mixture Density Networks for Hybrid Unit Selection Synthesis》,詳實(shí)展現(xiàn)了蘋果在語音助手 Siri 上的***進(jìn)展與成果。其中***篇文章討論了一項(xiàng)利用聲學(xué)模型數(shù)據(jù)的遷移學(xué)習(xí)技術(shù),它可以顯著提升新語言版本 Siri 的精確度。機(jī)器之心隨后將奉獻(xiàn)上第二篇、第三篇博文,敬請(qǐng)讀者期待。

用戶希望 Siri 的語音識(shí)別功能保持穩(wěn)定,不受語言、設(shè)備、聲音環(huán)境或者通信信道帶寬的影響。正如其他監(jiān)督式機(jī)器學(xué)習(xí)任務(wù)一樣,高精度的獲取通常需要大量的標(biāo)注數(shù)據(jù)。無論何時(shí)在 Siri 中部署新的語言,或者擴(kuò)展 Siri 以支持不同的音頻信道帶寬,我們都面臨著是否有足夠數(shù)據(jù)來訓(xùn)練聲學(xué)模型的挑戰(zhàn)。本文中,我們討論了使用聲學(xué)模型數(shù)據(jù)的遷移學(xué)習(xí)技術(shù),該技術(shù)已經(jīng)投入使用。我們展示了,表征不僅可跨語言遷移,還可以跨音頻信道帶寬遷移。作為一個(gè)研究案例,我們專注于以新的 Siri 語言識(shí)別超過 8 kHz 藍(lán)牙耳機(jī)的窄帶音頻。我們的技術(shù)有助于顯著提升新語言版本 Siri 的精確度。

任何數(shù)量的域數(shù)據(jù)

即使你只有與訓(xùn)練域相關(guān)的有限數(shù)據(jù),它也很有價(jià)值。絕大多數(shù) Siri 的使用發(fā)生在寬帶音頻信道,只有很少一部分發(fā)生在窄帶信道(比如,8KHz 藍(lán)牙耳機(jī))。然而,從絕對(duì)意義上講,蘋果的大量客戶在窄帶信道上使用 Siri。在新語言版本的 Siri 發(fā)布之前,我們可以搜集的窄帶藍(lán)牙音頻的數(shù)量是有限的。盡管如此,我們的目標(biāo)仍是在***天就為客戶提供***的體驗(yàn)。

2014 年年中,Siri 啟動(dòng)了一個(gè)使用深度神經(jīng)網(wǎng)絡(luò)(DNN)的新語音識(shí)別引擎。該引擎首先引入到美式英語的 Siri 中,截至 2015 年年中,我們已經(jīng)把該引擎擴(kuò)展到 13 種語言。為了實(shí)現(xiàn)成功擴(kuò)展,我們必須使用發(fā)布前可收集的有限數(shù)量的轉(zhuǎn)錄數(shù)據(jù)來解決建立高質(zhì)量聲學(xué)模型的問題。對(duì)于寬帶音頻情況是這樣,例如通過 iPhone 麥克風(fēng)收集寬帶音頻,而對(duì)于通過藍(lán)牙耳機(jī)收集的窄帶音頻更是如此。

一個(gè)可以解決小數(shù)量窄帶藍(lán)牙音頻問題的方法是帶限(band-limit)相對(duì)較多、更易收集的寬帶音頻。實(shí)際上,我們發(fā)現(xiàn)在有限數(shù)量的窄帶藍(lán)牙音頻上訓(xùn)練的聲學(xué)模型依然優(yōu)于在更大數(shù)量的帶限寬帶音頻上訓(xùn)練的模型,這表明了聲學(xué)模型訓(xùn)練中域內(nèi)數(shù)據(jù)的價(jià)值(圖 1)。這就要求同時(shí)利用大量的寬帶音頻和有限的窄帶音頻。在這項(xiàng)工作中,我們?cè)谶w移學(xué)習(xí)框架中調(diào)查了神經(jīng)網(wǎng)絡(luò)初始化 [1], [2]。

表 1 :窄帶藍(lán)牙測(cè)試中的詞錯(cuò)率(WER)

跨語言初始化

很多研究者認(rèn)為 [3] [4] [5] 神經(jīng)網(wǎng)絡(luò)聲學(xué)模型的隱藏層可以跨語言共享。背后原理在于隱藏層學(xué)習(xí)的特征變換(feature transformation)不太指定具體語言,因此可以在多種語言之間泛化。

圖 2. 跨語言初始化

我們將訓(xùn)練好的現(xiàn)有語言窄帶 DNN 模型的隱藏層遷移到新的目標(biāo)語言,并使用目標(biāo)語言數(shù)據(jù)重新訓(xùn)練該網(wǎng)絡(luò),如圖 2 所示。

即使我們用不同的源 DNN 進(jìn)行嘗試,使用所有可用的窄帶訓(xùn)練數(shù)據(jù)進(jìn)行跨語言初始化訓(xùn)練的效果通常顯著優(yōu)于基線(詳見 [6])。即使只有 20 個(gè)小時(shí)的窄帶數(shù)據(jù),對(duì)大多數(shù)語言來說,使用英語窄帶模型開始跨語言訓(xùn)練優(yōu)于使用更多窄帶數(shù)據(jù)的基線。而當(dāng)我們思考源語言和目標(biāo)語言之間的語言關(guān)系時(shí),我們無法得出結(jié)論。

跨帶寬初始化

圖 3. 跨帶寬初始化

在最初的實(shí)驗(yàn)中,我們發(fā)現(xiàn)使用較少真實(shí)窄帶藍(lán)牙音頻數(shù)據(jù)訓(xùn)練的模型優(yōu)于使用較多帶限寬帶數(shù)據(jù)訓(xùn)練的模型。但是,在一種語言中使用帶限數(shù)據(jù)訓(xùn)練的模型作為初始化的起點(diǎn)仍然是有用的。我們?cè)谡鎸?shí)窄帶藍(lán)牙音頻數(shù)據(jù)上重新訓(xùn)練帶限模型。用這種方式,我們能夠使用一種語言的寬帶和窄帶數(shù)據(jù)來訓(xùn)練窄帶模型(見圖 3)。

跨語言和跨帶寬遷移的結(jié)合

看到前兩個(gè)遷移學(xué)習(xí)技術(shù)的成功之后,我們認(rèn)為我們可以結(jié)合這兩種技術(shù),實(shí)現(xiàn)更進(jìn)一步的發(fā)展。具體來說,我們?cè)谝粋€(gè)新的語言的帶限寬帶數(shù)據(jù)上訓(xùn)練 DNN 時(shí),不需要使用隨機(jī)權(quán)重開始,但是可以初始化在已支持的語言的帶限數(shù)據(jù)上訓(xùn)練的 DNN 模型中的隱藏層。

圖 4. 跨語言和跨帶寬初始化的結(jié)合

圖 5. 跨語言和跨帶寬初始化的詞錯(cuò)率對(duì)比

結(jié)論

我們利用從其他語音識(shí)別任務(wù)中獲取的知識(shí)來改善窄帶藍(lán)牙應(yīng)用的 DNN 聲學(xué)模型。這類知識(shí)通常從 DNN 聲學(xué)模型初始化中獲取,具體來說,就是使用在帶限寬帶數(shù)據(jù)上預(yù)訓(xùn)練的 DNN 的權(quán)重,或者將其用于另一種語言。

對(duì)于我們實(shí)驗(yàn)中使用的全部語言,這些技術(shù)產(chǎn)生的詞錯(cuò)率比只在目標(biāo)語言的藍(lán)牙窄帶數(shù)據(jù)中單獨(dú)訓(xùn)練的模型低 45%。我們的方法還可以靈活地在訓(xùn)練時(shí)間和從可用的多樣化數(shù)據(jù)中學(xué)習(xí)之間進(jìn)行權(quán)衡,詳情見論文 [6]。

除本文論述的藍(lán)牙窄帶模型案例研究外,這些方法在很多神經(jīng)網(wǎng)絡(luò)聲學(xué)模型場(chǎng)景中都顯示出其高效性,并且?guī)椭覀冊(cè)?nbsp;Siri 使用新語言和新音頻信道時(shí)構(gòu)建***模型。 

責(zé)任編輯:張燕妮 來源: 推酷
相關(guān)推薦

2009-09-14 09:04:17

CCNA考試CCNA

2011-03-25 09:56:40

Nagios 安裝

2022-10-10 09:10:51

家庭網(wǎng)絡(luò)網(wǎng)絡(luò)

2023-03-30 07:39:57

云計(jì)算虛擬化CPU

2011-03-09 09:30:52

Mina

2015-05-12 10:42:53

程序員代碼

2010-07-17 01:12:31

Telnet服務(wù)

2010-09-26 14:39:40

DHCP故障分析

2010-05-12 10:51:06

2011-08-03 10:33:05

網(wǎng)絡(luò)管理網(wǎng)絡(luò)拓?fù)涔芾?/a>

2013-06-28 09:35:04

Hypervisor虛擬化成本

2010-09-06 09:22:26

CSS語法

2011-03-21 09:22:46

Tomcat

2017-02-07 14:50:39

華為

2017-04-11 09:07:20

互聯(lián)網(wǎng)

2012-09-10 16:19:00

云計(jì)算公共云

2010-09-14 16:54:18

2018-03-18 15:51:59

人工智能潛力首席數(shù)據(jù)官

2018-03-19 09:35:37

人工智能

2009-04-07 11:07:16

網(wǎng)絡(luò)營(yíng)銷
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 亚洲一区国产精品 | 日韩在线观看网站 | 亚洲传媒在线 | 亚洲欧美一区二区三区国产精品 | 中国大陆高清aⅴ毛片 | 一级片成人 | 在线中文视频 | 91精品国产高清久久久久久久久 | 精品国产一区久久 | 日韩有码一区 | 性国产丰满麻豆videosex | 99精品视频免费观看 | 玖玖国产精品视频 | 国产九九九| 午夜精品一区二区三区在线观看 | 国产精品一区二区免费 | 一区二区三区观看视频 | 日韩成人在线视频 | 在线日韩| 看一级毛片视频 | 亚洲视频中文字幕 | 中文字幕在线观看av | 黄色片免费在线观看 | 久久久久成人精品免费播放动漫 | 免费观看www7722午夜电影 | 亚洲视频在线看 | 精品国产精品三级精品av网址 | 激情av网站 | 91色网站| 男女又爽又黄视频 | 一区二区欧美在线 | 国产精品中文字幕一区二区三区 | 精品视频一区二区三区 | 国产精品不卡 | 亚洲一区二区三区在线 | 亚洲欧美自拍偷拍视频 | 四虎影院在线观看av | 51ⅴ精品国产91久久久久久 | 国产美女久久 | 999精品在线观看 | 欧美精品一区二区免费视频 |