成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

微軟宣布重大里程碑:中英機器翻譯可與人類媲美

新聞 人工智能
日前,從微軟亞洲研究院官網了解到其研究團隊對外宣布,最新研發的機器翻譯系統在通用新聞報道測試集newstest2017的中-英測試集上,達到了可與人工翻譯媲美的水平。

 日前,從微軟亞洲研究院官網了解到其研究團隊對外宣布,最新研發的機器翻譯系統在通用新聞報道測試集newstest2017的中-英測試集上,達到了可與人工翻譯媲美的水平。

[[222700]]

據稱,這是首個在新聞報道的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統。

該系統模型包含了由微軟亞洲研究院研發的對偶學習、推敲網絡、聯合訓練和一致性規范技術。機器翻譯是自然語言處理領域最具挑戰性的研究任務之一。

微軟技術院士,負責微軟語音、自然語言和機器翻譯工作的黃學東稱,“這是對自然語言處理領域最具挑戰性任務的一項重大突破。在機器翻譯方面達到與人類相同的水平是所有人的夢想,我們沒有想到這么快就能實現。”

[[222701]]

據悉,​newstest2017新聞報道測試集由產業界和學術界的合作伙伴共同開發,并于去年秋天在WMT17大會上發布。為了確保翻譯結果準確且達到人類的翻譯水平,微軟研究團隊邀請了雙語語言顧問將微軟的翻譯結果與兩個獨立的人工翻譯結果進行了比較評估。

雖然此次突破意義非凡,但研究人員也提醒大家,這并不代表人類已經完全解決了機器翻譯的問題,只能說明我們離終極目標又更近了一步。微軟亞洲研究院副院長、自然語言計算組負責人周明表示,在WMT17測試集上的翻譯結果達到人類水平很鼓舞人心,但仍有很多挑戰需要我們解決,比如在實時的新聞報道上測試系統等。

附該系統包含的四大技術——

對偶學習(Dual Learning):

對偶學習的發現是由于現實中有意義、有實用價值的人工智能任務往往會成對出現,兩個任務可以互相反饋,從而訓練出更好的深度學習模型。例如,在翻譯領域,我們關心從英文翻譯到中文,也同樣關心從中文翻譯回英文;在語音領域,我們既關心語音識別的問題,也關心語音合成的問題;在圖像領域,圖像識別與圖像生成也是成對出現。此外,在對話引擎、搜索引擎等場景中都有對偶任務。

一方面,由于存在特殊的對偶結構,兩個任務可以互相提供反饋信息,而這些反饋信息可以用來訓練深度學習模型。也就是說,即便沒有人為標注的數據,有了對偶結構也可以做深度學習。另一方面,兩個對偶任務可以互相充當對方的環境,這樣就不必與真實的環境做交互,兩個對偶任務之間的交互就可以產生有效的反饋信號。因此,充分地利用對偶結構,就有望解決深度學習和增強學習的瓶頸,如“訓練數據從哪里來、與環境的交互怎么持續進行”等問題。

圖:對偶無監督學習框架

推敲網絡(Deliberation Networks):

“推敲”二字可以認為是來源于人類閱讀、寫文章以及做其他任務時候的一種行為方式,即任務完成之后,并不當即終止,而是會反復推敲。微軟亞洲研究院機器學習組將這個過程沿用到了機器學習中。推敲網絡具有兩段解碼器,其中第一階段解碼器用于解碼生成原始序列,第二階段解碼器通過推敲的過程打磨和潤色原始語句。后者了解全局信息,在機器翻譯中看,它可以基于第一階段生成的語句,產生更好的翻譯結果。

圖:推敲網絡的解碼過程

聯合訓練(Joint Training):

這個方法可以認為是從源語言到目標語言翻譯(Source to Target)的學習與從目標語言到源語言翻譯(Target to Source)的學習的結合。中英翻譯和英中翻譯都使用初始并行數據來訓練,在每次訓練的迭代過程中,中英翻譯系統將中文句子翻譯成英文句子,從而獲得新的句對,而該句對又可以反過來補充到英中翻譯系統的數據集中。同理,這個過程也可以反向進行。這樣雙向融合不僅使得兩個系統的訓練數據集大大增加,而且準確率也大幅提高。

圖:從源語言到目標語言翻譯(Source to Target)P(y|x) 與從目標語言到源語言翻譯(Target to Source)P(x|y)

一致性規范(Agreement Regularization):

翻譯結果可以從左到右按順序產生,也可以從右到左進行生成。該規范對從左到右和從右到左的翻譯結果進行約束。如果這兩個過程生成的翻譯結果一樣,一般而言比結果不一樣的翻譯更加可信。這個約束,應用于神經機器翻譯訓練過程中,以鼓勵系統基于這兩個相反的過程生成一致的翻譯結果。

責任編輯:張燕妮 來源: 環球科技
相關推薦

2009-03-18 13:10:59

多核服務器MIPS

2024-09-11 14:48:00

2010-10-11 10:52:58

Facebook

2009-09-22 15:35:04

IT歷史喬布斯

2010-04-06 09:17:29

Visual Stud

2011-09-10 19:23:22

2011-09-09 13:42:16

2025-02-20 11:29:21

2021-01-26 10:59:52

開源技術 數據

2013-09-27 16:51:47

2016-09-29 09:46:41

JavascriptWeb前端

2020-12-02 13:46:24

百度大腦

2015-01-21 15:33:11

Windows 10

2020-10-21 15:38:32

Facebook翻譯語言

2013-01-18 10:09:10

互聯網網絡發展撥號上網

2021-02-04 14:31:30

RISC-V架構GPU

2013-01-22 15:59:14

里程碑浪潮天梭K1

2022-04-02 08:00:00

人工智能機器學習技術

2015-07-28 11:29:59

電商亞馬遜沃爾瑪
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美一区二区免费 | 国产亚洲欧美在线视频 | 色播视频在线观看 | 一级片在线视频 | 久久33| 亚洲国产精品成人无久久精品 | 蜜臀久久99精品久久久久久宅男 | 国产清纯白嫩初高生在线播放视频 | 亚洲精品aⅴ | 国产精品久久777777 | 中文字幕乱码亚洲精品一区 | 成人欧美一区二区三区黑人孕妇 | 一级看片免费视频 | 精品国产一区二区久久 | 欧美极品少妇xxxxⅹ免费视频 | 国产精品一区在线观看 | 国产精品一区二区欧美黑人喷潮水 | 性色av网站| 91精品国产91久久久久久吃药 | 国产精品美女久久久久久免费 | 精品av | 国产在线高清 | 国产精品久久久久久久久免费桃花 | 欧美日一区二区 | 国产色99 | 久久日韩精品一区二区三区 | 777zyz色资源站在线观看 | 国产视频第一页 | 中文字幕一区二区三区精彩视频 | 天天操操操操操 | 综合五月 | 在线国产视频 | 91干b| 日本黄色大片免费 | 日韩国产精品一区二区三区 | 午夜小电影 | 一区二区高清 | 亚洲欧美日韩精品久久亚洲区 | 欧美在线视频a | 国产精品一区二区不卡 | 国产精品永久免费 |