谷歌發(fā)布大規(guī)模對話語料庫,涉及17個領(lǐng)域含1.8萬個注釋
在不需要額外數(shù)據(jù)和再訓(xùn)練的情況下,谷歌Assistant等人工智能助手如何更好地支持新服務(wù)?
這是谷歌的研究人員在最近的一項研究中試圖回答的問題,該研究引入了一種方法,在沒有領(lǐng)域特定參數(shù)的情況下跨服務(wù)使用模型。
作為它的一部分,該團(tuán)隊發(fā)布了一個語料庫——模式指導(dǎo)的對話(SGD)語料庫——他們聲稱這是最大的面向任務(wù)的對話語料的公開匯編。
軟件工程師Abhinav Rastogi 和谷歌研究工程負(fù)責(zé)人Pranav Khaitan在博客中寫道:“如今的虛擬助手幫助用戶完成各種各樣的任務(wù),包括查找航班、搜索附近的活動和電影、預(yù)訂、從網(wǎng)上獲取信息等等。”
“盡管取得了巨大的進(jìn)步……適應(yīng)性挑戰(zhàn)在最先進(jìn)的模型中常常被忽視。這部分是由于缺乏合適的數(shù)據(jù)集來匹配虛擬助理所面臨的規(guī)模和復(fù)雜性。”
為此,SGD包含18000多個人與虛擬助理之間的帶注釋的對話,涉及與17個領(lǐng)域服務(wù)的交互:從銀行、大事件到媒體、日歷、旅行和天氣等。
對于大多數(shù)領(lǐng)域,數(shù)據(jù)集包含幾個不同的api,其中許多api具有重疊的功能,但是不同的接口反映了典型的真實場景。評估集包含了訓(xùn)練集中沒有的服務(wù),主要用于量化模型對api變化或新api添加的魯棒性。
至于前面提到的模式指導(dǎo)方法,它利用每個服務(wù)或API及其相關(guān)屬性的自然語言描述來學(xué)習(xí)分布式語義表示,該語義表示作為對話系統(tǒng)的額外輸入,隨后作為單個模型實現(xiàn)。
該團(tuán)隊表示,統(tǒng)一模型是谷歌開源對話狀態(tài)跟蹤模型的核心,它促進(jìn)了不同服務(wù)中相似概念之間的公共知識表示,使得對訓(xùn)練數(shù)據(jù)中沒有的新服務(wù)進(jìn)行操作成為可能。
“我們相信,這個數(shù)據(jù)集將成為建立大規(guī)模對話模型的良好基準(zhǔn),”Rastogi和Khaitan寫道。“我們很興奮,并期待著研究界將以各種創(chuàng)新的方式利用它來推進(jìn)對話技術(shù)。”
新數(shù)據(jù)集和模型的發(fā)布是在谷歌Coached Conversational Preference Elicitation (CCPE)和Taskmaster-1(兩個人之間的一對對話數(shù)據(jù)集)的開源之后進(jìn)行的。(前者包括與人們就他們的電影喜好進(jìn)行的500次對話,總計1萬次,總計1.2萬次對話。)
谷歌將其描述為:向能夠?qū)崿F(xiàn)人類級別的性能的自然語言系統(tǒng)建模邁出了一步。