人工智能與VR結合:帶來體驗多樣性
人工智能服務——微軟認知服務(Microsoft Cognitive Services)最初包括視覺、語音、語言、知識和搜索五大類共 21 項 API。應用了這些 API 的系統能看、能聽、能說話,并且能理解和解讀我們通過自然交流所傳達的需求。目前整套微軟認知服務已經有 8 項向公眾開放,17 項向指定開發者開放預覽。微軟也會原有的基礎上持續增加新的 API,并不斷更新現有的 API。
最近微軟宣布把自定義語音服務(Custom Speech Service)添加到微軟認知服務中。自定義語音服務是一個高度靈活的語音轉換文本程序,結合了自定義智能語音識別服務(CRIS)和語言理解智能服務(LUIS)兩種前沿技術來實現。
CRIS 能夠應用于喧鬧的公共場所等復雜的環境中,幫助人們更方便地自定義語音識別。也可以用于幫助應用更好地理解非母語說話者或殘障人士等。
而 LUIS 可以幫助計算機理解我們言語背后的真正意圖。當前的語音指令往往是開發者通過設置一個或多個特定的詞組或者短語,系統才會發生響應。舉個生活例子,用戶需要說出“找咖啡”或者“帶我去找咖啡”,系統才會接收到指令打開地圖應用為其尋找附近的咖啡店。但是通過 LUIS,用戶只是說“我眼睛困得睜不開了,需要提神一下”,系統會理解到用戶的真正需求。
現在虛擬現實內容工作室 Human Interact 已經嘗試把微軟自定義語音服務與 VR 結合起來。
《Starship Commander》是一款語音互動 VR 體驗。玩家扮演一艘星際飛船的飛行員,與一部超級電腦和一位全息指揮官合作共同完成任務。游戲過程中,玩家通過語音交流來探索虛擬世界。得益于 CRIS 和 LUIS,兩個游戲角色對關于飛船和外星人的詞匯都能正確理解并作出響應。相比普通的 VR 游戲,《Starship Commander》更像是互動電影。
隨著人工智能和 VR 技術的發展,未來玩家與 NPC 的互動將會更自然、更具沉浸感。