專(zhuān)訪(fǎng)三桐:阿里人工智能搜索應(yīng)用的交互式未來(lái)
12月13-14日19:30,阿里巴巴技術(shù)協(xié)會(huì)、云棲社區(qū)聯(lián)合主辦并獨(dú)家直播的《2017阿里雙11技術(shù)十二講》將強(qiáng)勢(shì)來(lái)襲。本次雙11在線(xiàn)技術(shù)論壇將專(zhuān)注更深的科技層面,全方面展現(xiàn)時(shí)代更迭下的全新黑科技,帶你詳細(xì)了解2017阿里雙11背后的技術(shù),并為你提供與一線(xiàn)專(zhuān)家面對(duì)面溝通學(xué)習(xí)的機(jī)會(huì)。在本次峰會(huì)中,阿里巴巴資深算法專(zhuān)家三桐將帶來(lái)《人工智能在商品搜索中的應(yīng)用》主題分享,云棲社區(qū)直播報(bào)名傳送門(mén)。
搜索一直在用人工智能的前沿技術(shù)理解用戶(hù)和商品,提供智能的搜索購(gòu)物體驗(yàn),過(guò)去幾年在搜索意圖理解、語(yǔ)義匹配、用戶(hù)興趣感知、搜索排序策略、多場(chǎng)景協(xié)同優(yōu)化、智能交互等領(lǐng)域取得了重要的進(jìn)展。搜索的深度用戶(hù)感知網(wǎng)絡(luò)能夠根據(jù)用戶(hù)行為足跡和上下文實(shí)時(shí)感知用戶(hù)意圖、預(yù)測(cè)用戶(hù)興趣偏好和生成個(gè)性化的排序策略,感知網(wǎng)絡(luò)超過(guò)10B個(gè)參數(shù),已經(jīng)學(xué)習(xí)了幾千億次的用戶(hù)行為,并且會(huì)保持不間斷的增量學(xué)習(xí),讓模型越來(lái)越聰明;搜索利用多智能體協(xié)同學(xué)習(xí)技術(shù),實(shí)現(xiàn)了搜索多個(gè)異構(gòu)場(chǎng)景間的環(huán)境感知、通信和協(xié)同決策,實(shí)現(xiàn)聯(lián)合收益***化,而不是此消彼長(zhǎng);搜索的在線(xiàn)深度學(xué)習(xí),能夠在秒級(jí)完成從日志收集、模型訓(xùn)練再到模型實(shí)時(shí)部署,日均處理數(shù)千億次的樣本。本文對(duì)三桐進(jìn)行了專(zhuān)訪(fǎng),深入探討了人工智能在搜索的應(yīng)用。
阿里巴巴資深算法專(zhuān)家 三桐
三桐,2008年加入阿里巴巴,目前負(fù)責(zé)淘寶個(gè)性化和排序團(tuán)隊(duì)。他曾先后負(fù)責(zé)過(guò)相關(guān)性、query分析、個(gè)性化、排序、智能交互等方向,目前專(zhuān)注淘寶商品搜索算法方向。此外三桐還主持過(guò)多個(gè)搜索重大技術(shù)項(xiàng)目,致力于推動(dòng)大規(guī)模機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、在線(xiàn)學(xué)習(xí)、多智能體、遷移學(xué)習(xí)、知識(shí)圖譜等在商品搜索的應(yīng)用。
人工智能搜索
人工智能在搜索的應(yīng)用范圍是非常廣的,具體包括這么幾個(gè)方面:首先是語(yǔ)義搜索,通過(guò)深度學(xué)習(xí)和知識(shí)圖譜技術(shù),解決用戶(hù)搜索查詢(xún)意圖和商品內(nèi)容的語(yǔ)義匹配問(wèn)題;其次是智能交互,通過(guò)感知用戶(hù)搜索狀態(tài),幫助用戶(hù)完成查詢(xún)意圖細(xì)化或切換,或通過(guò)智能問(wèn)答技術(shù)解決售前售后導(dǎo)購(gòu)問(wèn)題;再次是個(gè)性化匹配,主要是根據(jù)用戶(hù)行為足跡和上下文實(shí)時(shí)感知用戶(hù)意圖、用戶(hù)興趣偏好和生成個(gè)性化的排序策略;***是智能決策,主要是指通過(guò)強(qiáng)化學(xué)習(xí)和多智能體等技術(shù)解決搜索排序中的策略探索和優(yōu)化問(wèn)題。
三桐表示,阿里的搜索智能化之路經(jīng)歷了幾年的發(fā)展和應(yīng)用,結(jié)合淘寶商品搜索業(yè)務(wù)特點(diǎn),我們構(gòu)建了一套有特色的人工智能技術(shù)體系,包括電商知識(shí)圖譜,實(shí)時(shí)計(jì)算平臺(tái),離線(xiàn)深度學(xué)習(xí)平臺(tái),在線(xiàn)深度學(xué)習(xí)平臺(tái),智能決策平臺(tái)和在線(xiàn)深度預(yù)測(cè)平臺(tái)。
阿里的搜索智能化發(fā)展之路
雙11的商品搜索及技術(shù)解讀
“商品搜索是電商業(yè)務(wù)的核心技術(shù)”,雙11期間更是對(duì)搜索技術(shù)提出了更高的需求:首先是彈性計(jì)算,雙11高峰期搜索PV比平時(shí)大得多,系統(tǒng)需要根據(jù)流量情況實(shí)時(shí)調(diào)整機(jī)器資源;其次是實(shí)時(shí)計(jì)算、在線(xiàn)學(xué)習(xí)和在線(xiàn)預(yù)測(cè)能力,雙11用戶(hù)行為和平時(shí)大為不同,需要實(shí)時(shí)捕獲用戶(hù)興趣偏好,在線(xiàn)更新個(gè)性化模型和實(shí)時(shí)預(yù)估;***是排序策略,根據(jù)雙11的需求特點(diǎn)要求系統(tǒng)能夠?qū)崟r(shí)調(diào)整排序策略。
對(duì)于雙11海量的搜索請(qǐng)求,搜索技術(shù)也經(jīng)歷了相應(yīng)的演進(jìn)歷程。一方面,系統(tǒng)和算法性能持續(xù)優(yōu)化,致力提升系統(tǒng)性能;另一方面,通過(guò)彈性技術(shù)的應(yīng)用來(lái)提高機(jī)器使用效率;此外也有通過(guò)異構(gòu)計(jì)算等,解決深度模型稠密計(jì)算等問(wèn)題。今年的雙11,還采用了很多新的技術(shù)和算法,包括在線(xiàn)深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、多智能體、多任務(wù)學(xué)習(xí)、離在線(xiàn)混布等。新技術(shù)和新算法的應(yīng)用下,基于強(qiáng)化學(xué)習(xí)的智能交互極大提高了交互和搜索的整體收益,基于深度學(xué)習(xí)的語(yǔ)義搜索大大提高了搜索相關(guān)性,多任務(wù)學(xué)習(xí)下的個(gè)性化服務(wù)更是顯著提高了搜索的個(gè)性化體驗(yàn),還有多智能體技術(shù)實(shí)現(xiàn)的多個(gè)搜索場(chǎng)景聯(lián)合優(yōu)化等等。
阿里的智能搜索系統(tǒng)之個(gè)性化搜索
在搜索效率的提升上,今年更是取得了極為亮眼的成績(jī)。三桐提到,雙11當(dāng)天數(shù)據(jù)無(wú)線(xiàn)搜索通過(guò)智能搜索技術(shù)A/B-test GMV提升了12.1%,GMV同比提升高達(dá)56%。
挑戰(zhàn)及未來(lái)
人工智能愈演愈熱的大背景下,“搜索未來(lái)肯定會(huì)朝越來(lái)越智能的方向發(fā)展”。為了應(yīng)對(duì)復(fù)雜的個(gè)性化需求,阿里的智能搜索體系也一直致力于性能的不斷優(yōu)化,如引入Inference加速算法,實(shí)現(xiàn)降維、量化、剪枝、二值網(wǎng)絡(luò)等功能。
面對(duì)冷啟動(dòng)、超參數(shù)學(xué)習(xí)、多模交互、智能導(dǎo)購(gòu)、長(zhǎng)期收益和量化、線(xiàn)上線(xiàn)下結(jié)合、AI業(yè)務(wù)創(chuàng)新等新挑戰(zhàn),三桐表示會(huì)注重多場(chǎng)景聯(lián)合優(yōu)化來(lái)提高整體效率,比如搜索、推薦和廣告;life long learning,提高模型的用戶(hù)和商品理解能力;多目標(biāo)聯(lián)合優(yōu)化,實(shí)現(xiàn)搜索中用戶(hù)體驗(yàn)、賣(mài)家流量和平臺(tái)訴求多目標(biāo)的聯(lián)合優(yōu)化。除了當(dāng)搜索工具外,相信未來(lái)的搜索也會(huì)支持更優(yōu)化的智能交互方式,比如語(yǔ)音、自然語(yǔ)言對(duì)話(huà)等。
在12月13-14日19:30的雙11在線(xiàn)技術(shù)峰會(huì)上,屆時(shí)三桐將詳細(xì)介紹人工智能在搜索的應(yīng)用。預(yù)約直播敬請(qǐng)點(diǎn)擊:https://yq.aliyun.com/promotion/428。