客服機(jī)器人是怎么實(shí)現(xiàn)的?對(duì)話(huà)推薦系統(tǒng)
本文轉(zhuǎn)載自微信公眾號(hào)「活在信息時(shí)代」,作者活在信息時(shí)代。轉(zhuǎn)載本文請(qǐng)聯(lián)系活在信息時(shí)代公眾號(hào)。
大家在使用很多APP的時(shí)候,一定對(duì)于智能機(jī)器人客服系統(tǒng)都有所了解??头C(jī)器人就像真人客服一樣,可以與人進(jìn)行簡(jiǎn)單的對(duì)話(huà),并針對(duì)人們的需求給出相應(yīng)的回答。雖然大部分時(shí)間得到的答案并不怎么靠譜吧,但是總的還是比較節(jié)省人工的。
近期火熱的聊天機(jī)器人ChatGPT本質(zhì)上也是一個(gè)客服機(jī)器人,只不過(guò)它背后依據(jù)的算法更精細(xì),預(yù)訓(xùn)練的數(shù)據(jù)量也更大。
下面我們就一起來(lái)看看客服機(jī)器人背后的技術(shù):對(duì)話(huà)推薦系統(tǒng)。
一、對(duì)話(huà)推薦系統(tǒng)概述
用戶(hù)使用對(duì)話(huà)推薦系統(tǒng)的過(guò)程,本質(zhì)上是一個(gè)經(jīng)過(guò)多輪信息互動(dòng),最終協(xié)助用戶(hù)進(jìn)行決策的過(guò)程。
對(duì)話(huà)推薦系統(tǒng)(Conversational Recommendation System,CRS)通過(guò)豐富的交互行為,打破了靜態(tài)推薦系統(tǒng)中系統(tǒng)與用戶(hù)之間信息不對(duì)稱(chēng)的壁壘,允許推薦系統(tǒng)在與用戶(hù)的交互對(duì)話(huà)中,動(dòng)態(tài)捕捉用戶(hù)偏好。一方向通過(guò)探索用戶(hù)當(dāng)前的興趣偏好,引導(dǎo)用戶(hù)發(fā)現(xiàn)自己新的興趣點(diǎn)。另一方面,在交互過(guò)程中,實(shí)時(shí)接受用戶(hù)的反饋,更新推薦模型的策略,實(shí)現(xiàn)動(dòng)態(tài)學(xué)習(xí)與更新。這是一種以推薦為目標(biāo)導(dǎo)向的對(duì)話(huà)系統(tǒng),通過(guò)與用戶(hù)的在線對(duì)話(huà)達(dá)到捕捉用戶(hù)興趣從而推薦用戶(hù)所需要的答案或者商品的目的。
一般的對(duì)話(huà)系統(tǒng)通常分為兩類(lèi):任務(wù)導(dǎo)向型和非任務(wù)導(dǎo)向型。后者即是人們通常所說(shuō)的聊天機(jī)器人。而任務(wù)導(dǎo)向的對(duì)話(huà)系統(tǒng)旨在幫助用戶(hù)完成具體的任務(wù),例如幫助用戶(hù)找尋所需要的商品、預(yù)訂酒店餐廳等。面向推薦任務(wù)的任務(wù)導(dǎo)向型對(duì)話(huà)系統(tǒng),通??梢钥醋魇且宰匀徽Z(yǔ)言文字、語(yǔ)音為交互形式的對(duì)話(huà)推薦系統(tǒng)。在推薦任務(wù)中,具有較高的商業(yè)價(jià)值。
二、對(duì)話(huà)推薦任務(wù)的特點(diǎn)
從對(duì)話(huà)推薦系統(tǒng)的應(yīng)用上來(lái)看,具有兩個(gè)典型的特點(diǎn):多輪交互和目標(biāo)導(dǎo)向。
1、多輪交互
傳統(tǒng)的系統(tǒng)中,例如在淘寶搜索商品的時(shí)候,用戶(hù)尋找具有特定屬性的商品時(shí),會(huì)通過(guò)主動(dòng)搜索來(lái)進(jìn)行。例如,可以搜索“春季的男士外套”,在這個(gè)場(chǎng)景中,用戶(hù)自己構(gòu)造查詢(xún),推薦效果不僅依賴(lài)于搜索引擎,更多是依賴(lài)用戶(hù)自己的專(zhuān)業(yè)知識(shí)來(lái)構(gòu)造合適的查詢(xún)關(guān)鍵詞。這種傳統(tǒng)的推薦系統(tǒng)需要用戶(hù)根據(jù)自己的先驗(yàn)知識(shí)輸入可能的屬性選項(xiàng),才能準(zhǔn)確定位到合適的商品。但是在很多場(chǎng)景中,用戶(hù)并不具有這樣的先驗(yàn)知識(shí)。這種情況下,用戶(hù)期望系統(tǒng)能夠主動(dòng)向用戶(hù)介紹他們可能喜歡的潛在物品。
而對(duì)話(huà)推薦系統(tǒng)中的多輪交互特點(diǎn)可以彌補(bǔ)傳統(tǒng)推薦系統(tǒng)中用戶(hù)主動(dòng)搜索的不足。在系統(tǒng)與用戶(hù)的實(shí)時(shí)互動(dòng)中,可以通過(guò)主動(dòng)向用戶(hù)提問(wèn)的方式,向用戶(hù)展示用戶(hù)未知的物品屬性空間,并利用用戶(hù)的反饋信息,直接了解用戶(hù)對(duì)某些屬性的需求和態(tài)度,構(gòu)建用戶(hù)興趣畫(huà)像,從而做出正確的推薦。
2、目標(biāo)導(dǎo)向
對(duì)話(huà)推薦系統(tǒng)要實(shí)現(xiàn)的目標(biāo)任務(wù)是給用戶(hù)推薦用戶(hù)感興趣的商品,因此以實(shí)現(xiàn)成功推薦為最終目標(biāo),進(jìn)行獲取用戶(hù)偏好信息的交互,CRS與傳統(tǒng)推薦系統(tǒng)有同樣的“推薦”目標(biāo),但是二者在系統(tǒng)的運(yùn)作與實(shí)現(xiàn)上完全不同。傳統(tǒng)的推薦系統(tǒng)可以看作是系統(tǒng)單方面向用戶(hù)輸出推薦物品。而CRS則注重實(shí)用的實(shí)時(shí)反饋,不斷主動(dòng)試探用戶(hù)興趣點(diǎn),并更新后續(xù)的推薦策略。
三、對(duì)話(huà)推薦系統(tǒng)的基本功能模塊
一個(gè)標(biāo)準(zhǔn)的對(duì)話(huà)推薦系統(tǒng)由三個(gè)功能模塊組成:用戶(hù)意圖理解模塊、對(duì)話(huà)策略模塊和推薦模塊。
1、用戶(hù)意圖理解模塊
用戶(hù)意圖理解模塊是與用戶(hù)直接交換信息的模塊,其輸入早年主要是對(duì)話(huà)文本,而隨著技術(shù)的發(fā)展,多模態(tài)數(shù)據(jù)和用戶(hù)行為數(shù)據(jù)也越來(lái)越成為對(duì)話(huà)推薦系統(tǒng)主要的輸入數(shù)據(jù)來(lái)源。
2、對(duì)話(huà)策略模塊
對(duì)于推薦系統(tǒng)而言,能夠基于的正反饋數(shù)據(jù)是非常少的,這就造成了系統(tǒng)與用戶(hù)之間的信息并不匹配,而一次失敗的探索將浪費(fèi)用戶(hù)的時(shí)間,傷害用戶(hù)的偏好,進(jìn)行造成用戶(hù)的流失。因此,追求探索和收益的平衡是對(duì)話(huà)推薦系統(tǒng)中的一個(gè)關(guān)鍵問(wèn)題。對(duì)話(huà)策略模塊的主要任務(wù)就是解決這一問(wèn)題。
在多輪交互過(guò)程中,這一問(wèn)題表現(xiàn)為系統(tǒng)在交互過(guò)程中需要確定當(dāng)前是否要繼續(xù)詢(xún)問(wèn)用戶(hù),還是基于已經(jīng)獲取到的信息來(lái)實(shí)現(xiàn)推薦商品,從而增加用戶(hù)選擇商品的概率。這是一個(gè)典型的博弈問(wèn)題。過(guò)多的詢(xún)問(wèn)可能造成用戶(hù)的厭惡,而過(guò)少的詢(xún)問(wèn)又會(huì)造成用戶(hù)偏好信息的缺失。因此,好的對(duì)話(huà)策略需要智能地平衡對(duì)話(huà)輪次與推薦準(zhǔn)確率兩個(gè)指標(biāo)。
3、推薦模塊
推薦模塊是對(duì)話(huà)推薦系統(tǒng)中實(shí)現(xiàn)推薦功能的模塊,根據(jù)已經(jīng)捕捉到的用戶(hù)信息,推薦用戶(hù)當(dāng)前最感興趣的目標(biāo)物品。在大部分的CRS中,推薦模塊都采用簡(jiǎn)單的推薦模型,例如矩陣分解,這是因?yàn)楹?jiǎn)單的推薦模型已經(jīng)能夠滿(mǎn)足對(duì)話(huà)推薦系統(tǒng)的推薦需求,使用過(guò)于復(fù)雜的推薦模型,反而會(huì)使系統(tǒng)整體復(fù)雜度上升,使對(duì)話(huà)推薦系統(tǒng)的訓(xùn)練變得困難。