微軟亞研前沿技術:實時語音翻譯、Kinect 手語翻譯
在微軟亞洲研究院十五周年的紀念活動上,微軟亞研院長洪小文以一幅九宮格數字圖講述了研究院過去十五載的故事。作為微軟公司在美國本土以外最大的基礎研究機構,微軟亞研通過一些前瞻性的基礎性研究、產品來推動技術轉移,融入微軟產品,支持公司戰略。
在昨天的活動現場,我們親身體驗了一些前瞻性技術和產品,包括大數據與機器學習、云計算與移動技術、自然用戶界面以及科技引領產品創新等等。它們尚未轉化為商用技術,但從中我們可以一窺未來技術生活的圖景。
實時語音翻譯系統
現場展示了微軟實時語音翻譯系統,系統可以將用戶所說的話翻譯成另一種語言并通過語音播放出來,此外,它可以保留用戶說話時具有的口音、音色和語調,盡可能地還原說話者的聲音。目前,這種方法可以實現微軟語音平臺支持的所有 26 種語言間的互譯。
現場演示雖然出現一些翻譯錯誤,但基本上實現了簡單溝通的目的。我們了解到,使用這種語音翻譯軟件,用戶需要進行約一個小時的訓練,為自己的語音建立一個模式,并與微軟的標準文字-語音模式融為一體,用于對目標語言的翻譯。
(??Youku??)
基于 Kinect 的手語翻譯系統:與聽障人士自由對話
洪小文在現場重點展示了“基于 Kinect 的手語翻譯系統”。這套系統借助了 Kinect 體感設備捕捉色彩和深度圖像信息,對手語進行識別和翻譯,可以同時對漢語手語和英語手語進行識別與翻譯,并通過語音反饋出來。
除此之外,系統可以將文本信息反向翻譯為手語,從而實現與聽障人士的正常溝通。
(??Youku??)
用大數據推斷空氣質量
當代都市人群對居住的生活環境越發關注,然而特別在大城市,不同地點的空氣質量差異很大,而目前人們只能借助城市布局的有限的監測站進行判斷,想要隨時了解身邊的空氣質量幾乎不可能。
在展示區,我們看到了這樣一套可以實時推斷城市任一地點空氣質量的系統,它運用數據挖掘和機器學習技術,對大數據進行充分利用,在監測信息和對應結果之間建立一個隱式的映射,從而實時推斷出任一地點的空氣質量數據。
據工作人員介紹,這一系統的數據來源包括氣象狀況、交通流量、人員流動趨向、路網結構以及人口集中點等等。
開發人員還為改系統開發了一款 Windows Phone 應用,除了顯示當前所在位置的空氣質量指數,用戶可以自由在手機地圖中選點,并以可視化的方式呈現出來。
Power Map:讓 Excel 的數據活起來
在 Excel 中,用戶可以借助 2D 圖表功能,將數據轉化為餅圖、條形圖等可視化形式,便于 PPT 演示。在展示區,我們看到了一款將 Excel 數據轉化為 3D 的可視化工具。
現場以 2008 年奧運會中國獎牌信息統計表為例,不同省份的獎牌數、獎牌種類可以通過 3D 柱形圖映射到地圖上,
洪小文表示,這一技術已經進入到 beta 階段,相信不久就可以作為 3D 數據可視化的工具融入到 Excel 之中。