嘉賓 | 楊洋
撰稿 | 黃顯東
8月6日-7日,??AISummit 全球人工智能技術(shù)大會??成功舉辦。本屆大會以“驅(qū)動?創(chuàng)新?數(shù)智”為主題,覆蓋“計算機(jī)視覺、自然語言處理、算法與模型、推薦系統(tǒng)、機(jī)器學(xué)習(xí)、智慧金融”等技術(shù)領(lǐng)域。
在《機(jī)器學(xué)習(xí)性能優(yōu)化之路》專場中,滴滴首席工程師楊洋通過《個性化推薦在數(shù)據(jù)運(yùn)營中的創(chuàng)新應(yīng)用》的主題分享,為開發(fā)者分享了機(jī)器學(xué)習(xí)在數(shù)據(jù)運(yùn)營中的探索應(yīng)用。
數(shù)據(jù)運(yùn)營的價值與挑戰(zhàn)
數(shù)據(jù)運(yùn)營離不開數(shù)據(jù)體系。在理想的數(shù)據(jù)體系全景中,預(yù)期的主要看數(shù)方式包括數(shù)據(jù)產(chǎn)品、數(shù)據(jù)服務(wù)、數(shù)據(jù)倉庫,以及基礎(chǔ)性的臨時需求。數(shù)據(jù)產(chǎn)品主要用來支持運(yùn)營等非技術(shù)人員的看數(shù)需求;數(shù)據(jù)服務(wù)是通過API的方式對接各種各樣的業(yè)務(wù)系統(tǒng);數(shù)據(jù)倉庫是通過資產(chǎn)化方式,對有一定技術(shù)能力的人員提供SQL的取數(shù)方式。
完整的看數(shù)過程中,數(shù)據(jù)運(yùn)營是貫穿始終的,一方面可以充當(dāng)溝通渠道,對內(nèi)指導(dǎo)數(shù)據(jù)建設(shè);另一方面可以告知用戶我們擁有的數(shù)據(jù)內(nèi)容,持續(xù)向用戶進(jìn)行培訓(xùn)和宣貫。
在理想的情況下,通過產(chǎn)品化的方式來滿足大多數(shù)的看數(shù)需求,這樣便可以將整體的研發(fā)人力從臨時需求中解救出來,投入到資產(chǎn)化的工作當(dāng)中,從而持續(xù)提升數(shù)據(jù)指標(biāo)。
不過,理想和現(xiàn)實(shí)總是有差距的。在日常工作中,總會遇到各種各樣的數(shù)據(jù)易用性問題或者數(shù)據(jù)一致性問題。這些問題的背后也是整個數(shù)據(jù)體系的熵增定律,任何體系的架構(gòu),它在孤立無外力的情況下,都會隨著時間的推移逐步腐壞。
同時,在產(chǎn)業(yè)互聯(lián)網(wǎng)的發(fā)展階段也為數(shù)據(jù)運(yùn)營帶來一些新的挑戰(zhàn)。從生產(chǎn)視角上看,多數(shù)業(yè)務(wù)場景正處于線上化探索期的產(chǎn)業(yè)互聯(lián)網(wǎng)會導(dǎo)致數(shù)據(jù)迭代頻繁。從消費(fèi)視角來看,產(chǎn)業(yè)互聯(lián)網(wǎng)的整個組織架構(gòu)也更復(fù)雜多元。這兩個視角都會造成多樣化和個性化的看數(shù)視角。
此外,傳統(tǒng)的數(shù)據(jù)運(yùn)營推廣和培訓(xùn)的方式,也面臨時效性差、延續(xù)性差和針對性不足的痛點(diǎn),這些都會對運(yùn)營效果產(chǎn)生影響。
個性化推薦的探索落地
那如何基于個性化推薦技術(shù)來解決數(shù)據(jù)運(yùn)營的挑戰(zhàn)和痛點(diǎn)呢?
要解決這些問題,首先要對數(shù)據(jù)運(yùn)營的目標(biāo)場景做一個特點(diǎn)分析。典型的數(shù)據(jù)運(yùn)營場景可以分成三大類:第一類是用戶冷啟動場景,占比大概為20%,例如新人入職、業(yè)務(wù)變化、組織調(diào)整等;第二類是內(nèi)容冷啟動場景,占比60%,例如數(shù)據(jù)線上化或者分析功能迭代;然后通過數(shù)據(jù)運(yùn)營的手段觸達(dá)用戶;第三類場景是常態(tài)化的運(yùn)營場景,通過常態(tài)化的運(yùn)營手段,持續(xù)提升業(yè)務(wù)的數(shù)據(jù)化運(yùn)營程度,以及實(shí)現(xiàn)一些運(yùn)營經(jīng)驗(yàn)的復(fù)用。
通過目標(biāo)場景的特點(diǎn)分析,可以得出一些典型的特點(diǎn)。從內(nèi)容方面上來看,數(shù)據(jù)內(nèi)容推薦可以使用OneDate的指標(biāo)體系,實(shí)現(xiàn)更高程度的規(guī)范性和結(jié)構(gòu)化。從推薦用戶的角度來看,數(shù)據(jù)內(nèi)容推薦可以針對性的獲取企業(yè)內(nèi)部用戶比較規(guī)范完整的組織架構(gòu)信息。從推薦目標(biāo)上來看,數(shù)據(jù)內(nèi)容推薦更加關(guān)注準(zhǔn)確性,同時消費(fèi)成本也更高。
基于以上分析,可以構(gòu)建出數(shù)據(jù)內(nèi)容推薦算法的設(shè)計思路。對于用戶冷啟動場景可以使用組織架構(gòu)的熱度信息,構(gòu)建一個的推薦的策略;對與內(nèi)容冷啟動場景可以基于OneDate+指標(biāo)血緣的content-based推薦,對內(nèi)容和用戶實(shí)現(xiàn)精準(zhǔn)的雙向匹配。對于常態(tài)化的推薦可以基于用戶行為策略+業(yè)務(wù)階段方向,實(shí)現(xiàn)高可控和高可解釋性的推薦策略
有了初步的算法設(shè)計思路,可以基于此將一個全周期的數(shù)據(jù)運(yùn)營系統(tǒng)落地。具體包括三方面:首先根據(jù)算法實(shí)現(xiàn)一個具備用戶生命周期策略和推薦策略的數(shù)據(jù)服務(wù)推薦引擎;其次是打通觸達(dá)渠道,對郵件、辦公軟件等實(shí)現(xiàn)智能觸達(dá),并提供手動觸達(dá)作為補(bǔ)充;最后是對前面的兩個能力做工具話和產(chǎn)品化的封裝,以服務(wù)更多的場景。
機(jī)器學(xué)習(xí)在數(shù)據(jù)運(yùn)營領(lǐng)域的未來規(guī)劃和展望
未來,機(jī)器學(xué)習(xí)在數(shù)據(jù)運(yùn)營領(lǐng)域也會有廣闊的發(fā)展空間。短期內(nèi)產(chǎn)生價值的可以基于業(yè)務(wù)線、主題等個性化搜索排序,進(jìn)行數(shù)據(jù)檢索工具的集成,可以更高效地幫助用戶找到數(shù)據(jù)。
基于數(shù)據(jù)推薦反向指導(dǎo)數(shù)據(jù)建設(shè)這個發(fā)展方向還需要進(jìn)一步探索。在數(shù)據(jù)建設(shè)的整體決策階段,可以預(yù)先使用推薦來預(yù)估潛在的用戶量和潛在的訪問量,為數(shù)據(jù)建設(shè)提供相對數(shù)據(jù)化的量化參考。此外在內(nèi)容設(shè)計和可視化方面,也可以根據(jù)數(shù)據(jù)化的分析來提供更加科學(xué)和數(shù)據(jù)化決策指導(dǎo)。