如何構(gòu)建好的用戶畫像平臺?
一、畫像平臺產(chǎn)品架構(gòu)
上圖是基于快看數(shù)據(jù)中臺畫像平臺產(chǎn)品的理解和定位整理出來的產(chǎn)品架構(gòu)。
畫像平臺首先是服務(wù)于業(yè)務(wù)的,運營可以基于畫像平臺對單個用戶或者人群包做畫像的洞察,平臺服務(wù)的業(yè)務(wù)應(yīng)用層包含:
(1)個性化推薦:它對畫像的使用是非常重的,能夠基于每個用戶的畫像去做千人千面的內(nèi)容分發(fā)。
(2)精細化運營:產(chǎn)品運營對用戶做精細化營銷的時候,會使用畫像平臺的人群圈選,依賴平臺的人群洞察分析能力。
(3)精準營銷:商業(yè)化側(cè)如精準營銷,會依賴畫像平臺,針對內(nèi)容或者產(chǎn)品特點,精準觸達一定偏好的用戶,提高營銷效率。
(4)獲客推廣:渠道獲客推廣對畫像平臺的應(yīng)用也非常多,依賴也很重。
畫像平臺產(chǎn)品服務(wù)層的功能一般包含如下這些:
(1)人群圈選:指根據(jù)用戶畫像的標簽或者特定的維度篩選出需要使用的人群包,然后對人群包中的用戶做一些特定的操作。
(2)人群計算:對多個人群包進行交、差、并等操作。
(3)人群洞察:對特定的人群包基于用戶的標簽或者維度去分析其分布以及特點規(guī)律。
(4)人群包管理:畫像平臺上能夠清晰有效的管理創(chuàng)建出的人群包,進行體系化的管理和展示。
(5)標簽管理:畫像平臺最重要的信息就是用戶的畫像標簽,需要對這些標簽進行一個體系化的管理。
(6)Look-alike:快看數(shù)據(jù)中臺在建設(shè)畫像平臺的時候,這方面的訴求不多,公司的廣告業(yè)務(wù)自己實現(xiàn)了 Look-alike 功能,因此這里不做詳細說明。
(7)功能 API 和畫像查詢 API:畫像產(chǎn)品和業(yè)務(wù)的對接中,會收到業(yè)務(wù)側(cè)對畫像平臺功能 API 和查詢 API 等 API 接口的需求。有了 API,運營系統(tǒng)或營銷系統(tǒng)能夠便捷的接入畫像平臺的特定功能,使用畫像平臺的人群畫像。
建設(shè)畫像平臺,需要實現(xiàn)對數(shù)據(jù)生產(chǎn)、數(shù)倉建模以及標簽數(shù)據(jù)體系的管理。我們基于數(shù)據(jù)倉庫模型,對畫像數(shù)據(jù)進行體系化的管理,主要有三部分:
(1)數(shù)據(jù)域建模:首先基于數(shù)據(jù)倉庫對多條業(yè)務(wù)線的數(shù)據(jù)進行分數(shù)據(jù)域的建模管理。主要是對公司數(shù)據(jù)進行數(shù)倉的分層,并在數(shù)倉的 DWD/DWS 偏底層的部分,對我們的業(yè)務(wù)數(shù)據(jù)域進行分域的管理,以保證不同業(yè)務(wù)線的數(shù)據(jù)能有清晰的管理存儲以及位置查詢。
(2)標簽計算和挖掘:有了基礎(chǔ)數(shù)據(jù)之后,需要進行標簽計算和挖掘,生產(chǎn)標簽。
(3)畫像主題建模:生產(chǎn)的標簽會存儲在數(shù)倉的主題層。快看建設(shè)了專門的畫像主題,畫像主題對畫像平臺所有的標簽體系以及用戶標簽相關(guān)的數(shù)據(jù),進行了建模和管理。
再下面就是數(shù)據(jù)采集層,包括埋點平臺、業(yè)務(wù)日志、業(yè)務(wù) DB 數(shù)據(jù)以及三方數(shù)據(jù)。把數(shù)據(jù)采集上來,進行數(shù)據(jù)側(cè)的 ETL 清洗提取,轉(zhuǎn)化成數(shù)據(jù)倉庫模型里面的基礎(chǔ)數(shù)據(jù)。
一般來說,這是畫像平臺從業(yè)務(wù)側(cè)到數(shù)據(jù)采集側(cè)全鏈路的產(chǎn)品架構(gòu)。
討論完產(chǎn)品架構(gòu)之后,繼續(xù)探討另外一個話題,公司內(nèi)部什么樣的組織適合搭建畫像平臺,以及它的定位是什么?
根據(jù)我的理解總結(jié)了兩方面畫像平臺的定位:
(1)業(yè)務(wù)內(nèi)自建平臺。在很多公司,一些比較大的業(yè)務(wù)線,是有能力去建設(shè)自己的畫像平臺的,特點是畫像平臺建設(shè)是服務(wù)于本業(yè)務(wù)線的,在本業(yè)務(wù)線內(nèi)去使用。一般要求業(yè)務(wù)線能夠具備相對比較完善的數(shù)據(jù)平臺能力,數(shù)據(jù)倉庫建模能力以及一定的數(shù)據(jù)挖掘能力,這些是進行畫像平臺數(shù)據(jù)生產(chǎn)的基礎(chǔ)。另外,業(yè)務(wù)內(nèi)自建畫像平臺因為只服務(wù)于單條業(yè)務(wù)線,往往會和自己業(yè)務(wù)運營的營銷系統(tǒng)或者 BI 報表或者數(shù)據(jù)監(jiān)控平臺等有相對比較重的耦合性。耦合性是指業(yè)務(wù)自建畫像平臺會在平臺內(nèi)部把運營能力(比如說配置能力或者分發(fā)能力),營銷能力(比如 PUSH 或者說短信觸達)以及精細化運營和精準營銷的數(shù)據(jù)回收計算、指標展示、監(jiān)控等功能都糅合到畫像平臺中。
(2)中臺型畫像平臺。快看有自己的數(shù)據(jù)中臺,各個業(yè)務(wù)也沒有足夠人手建設(shè)業(yè)務(wù)內(nèi)自建畫像平臺,所以快看的畫像平臺是由數(shù)據(jù)中臺部門建設(shè)的。它服務(wù)于多條業(yè)務(wù)線,每條業(yè)務(wù)線都可以基于自己的業(yè)務(wù)場景和訴求去使用。一個特點是平臺數(shù)據(jù)源是來自于多條業(yè)務(wù)線,所以數(shù)據(jù)源的標準性和一致性不好把控;另外因為業(yè)務(wù)和業(yè)務(wù)之間的差異很大,數(shù)據(jù)差異也非常大,不同領(lǐng)域數(shù)據(jù)模型的差異也非常大,所以數(shù)倉建模的復(fù)雜度是非常高的;再一個特點是中臺畫像平臺,要求平臺能力盡量和業(yè)務(wù)的運營系統(tǒng),營銷系統(tǒng)或者其他的報表平臺能夠做功能的解耦,因為如果中臺畫像平臺和某一個或者幾個業(yè)務(wù)的業(yè)務(wù)系統(tǒng)能力耦合過重,擴展性就會不好,平臺產(chǎn)品能力過于定制化是非常不利于將來的功能拓展和迭代設(shè)計優(yōu)化的。
這是不同的公司在不同的階段可能會面臨的一個選擇,大家可以根據(jù)自己公司實際的痛點問題選擇合適的自建方式。
二、快看畫像平臺建設(shè)經(jīng)驗
下面介紹快看建設(shè)中臺型畫像平臺的經(jīng)驗。
1、快看畫像平臺建設(shè)的背景
首先來介紹一下快看畫像平臺建設(shè)的背景,快看成立于 2014 年,是漫畫垂類下用戶體量最大的平臺,目前總用戶量近 3 億,主要業(yè)務(wù)有漫畫閱讀、二次元社區(qū)以及商業(yè)化等。
在業(yè)務(wù)需求方面:
(1)快看的業(yè)務(wù)發(fā)展非常快,業(yè)務(wù)線的數(shù)量和業(yè)務(wù)線的規(guī)模都在快速擴張,目前中臺支持了十多條業(yè)務(wù)線,公司還在不斷的孵化新的業(yè)務(wù)線,公司的業(yè)務(wù)規(guī)模也是不斷變化的。
(2)從 2018 年、2019 年之后,移動互聯(lián)網(wǎng)市場的用戶量增長就非常緩慢了,再加上短視頻行業(yè)的興起,用戶時間被短視頻行業(yè)搶占了很多,移動互聯(lián)網(wǎng)市場已經(jīng)變成了一個存量用戶競爭的紅海市場。各個 ToC 的產(chǎn)品為了能夠吸引用戶、提升用戶時長,各個業(yè)務(wù)對存量用戶的精細化運營和精準營銷的需求越來越多了。
前面的分析中可以看出各個業(yè)務(wù)對數(shù)據(jù)的依賴,對精細化運營操作的訴求,快看各個業(yè)務(wù)也會面臨這些問題和訴求。
數(shù)據(jù)中臺作為公司里面去統(tǒng)一承接各個業(yè)務(wù),各種數(shù)據(jù)場景,各種數(shù)據(jù)類需求的部門,在長期的對接中,逐漸感受到大家對畫像標簽的依賴越來越重,因此從各個業(yè)務(wù)對畫像平臺的通用訴求中提煉出最常見的對于畫像平臺一些依賴的能力以及對標簽的依賴的需求。
快看中臺從 2016 年初就開始建設(shè),大數(shù)據(jù)平臺的能力是比較完善的。對于數(shù)據(jù)采集、數(shù)據(jù) ETL、數(shù)倉建模這些方面都是有自己的模型以及方法論建設(shè)的,而且開發(fā)能力也相對比較完善。
2、快看畫像平臺功能簡介
上圖是快看畫像平臺的功能以及產(chǎn)品的界面,因為時間有限,分享的重點不在于我們每一個功能產(chǎn)品設(shè)計的邏輯,或者一個功能的具體實現(xiàn),而是想著重的跟大家去介紹一下我們在建設(shè)中臺型畫像產(chǎn)品的時候,遇到的 4 個比較難的問題,或者說我們認為一些關(guān)鍵的點。我們的產(chǎn)品能力前面已經(jīng)介紹過了,也都是比較通用的能力,因為我們做的是中臺型的畫像產(chǎn)品,建設(shè)目標就是為了滿足業(yè)務(wù)對畫像平臺、畫像標簽的通用需求。
我們平臺的功能可以概括為:標簽管理、人群圈選、人群上傳、人群計算、人群洞察和人群包管理。
接下來分享我們在快看建設(shè)中臺型畫像產(chǎn)品過程中遇到的 4 個比較有意思的問題。
(1)實踐1:弱登錄類型 App 建立設(shè)備 ID 標識
第一個問題是弱登錄類型 App 建立設(shè)備 ID 標識。
弱登錄類型的特點是用戶不需要強制登錄也能夠使用這個平臺的一些核心產(chǎn)品能力產(chǎn)品功能,像內(nèi)容型和工具型的 APP,大概都會符合這個特點。為了用戶能夠快速使用我們的核心功能,提高用戶轉(zhuǎn)化,產(chǎn)生用戶的激活留存,很少強制用戶授權(quán)登錄,所以允許用戶不需要登錄也可以使用 APP。
但是,各個業(yè)務(wù)又希望能夠?qū)π掠脩粢约袄钫倩氐挠脩艨焖俚漠a(chǎn)生深度連接,讓用戶能夠快速的產(chǎn)生興趣和粘性,這就需要做精細化運營或者精準營銷,而這些動作,都是要針對于非登陸用戶,基于設(shè)備的 ID 做一個動作。
所以設(shè)備的唯一性識別在畫像的建設(shè)中極其重要。如果設(shè)備的唯一性識別的準確性不高,將會產(chǎn)生比較大的問題。而提高設(shè)備 ID 的識別度,有以下的難點:
① Android/IOS 的 IMEI、IDFA、OAID 的獲取受限以及頻繁變更。Android 和 IOS 從系統(tǒng)層面對用戶隱私的保護機制是越來越強。以 Android 來說,從 Android 10 之后是不允許獲取用戶 IMEI 的,現(xiàn)在的新系統(tǒng)都是獲取不到的。以 IOS 來說,14.5 版本之后,獲取 IDFA 都需要彈窗用戶授權(quán)。在中國,華為、小米、OPPO、VIVO 等組成的廣告聯(lián)盟一起協(xié)作出了一個 OAID 作為廣告標識。上面這些 ID 或者不能獲取了,或者就是獲取的時候需要用戶授權(quán),造成一定的損失;再或者像 IDFA 和 OAID 面臨頻繁變更的情況,用戶是可以主動重置的,包括重置系統(tǒng),刷機,重裝 APP 等都可能造成 ID 的變更。這是是我們保證設(shè)備 ID 唯一性最大的困難。
② ID Mapping 的變更。各個業(yè)務(wù)希望基于各自對 ID 的依賴去做 ID Mapping。以廣告業(yè)務(wù)為例,廣告業(yè)務(wù)目前去做廣告投放或者廣告回傳效果監(jiān)測的時候,對 IMEI 和 IDFA 的使用現(xiàn)在還是很重的。他們希望不管你內(nèi)部使用哪種 ID,但是你需要能夠基于 IMEI 或者 IDFA 和本部門完成廣告投放方面的協(xié)作或者信息的打通回傳。如果我們對設(shè)備 ID 的獲取的覆蓋率以及它的變更無法精準識別,那當進行外部協(xié)作,比如與廣告業(yè)務(wù)的外部協(xié)作就會產(chǎn)生很大的折損,對效率造成影響。
作為中臺部門,我們在構(gòu)建畫像平臺的時候,首先需要解決這個問題,如果不解決,剛才提到的難點在業(yè)務(wù)側(cè)會產(chǎn)生很大的影響,我們的解決方案主要是兩個方向:
① 第一,快看能夠維護每個設(shè)備各個 ID 的映射和變更關(guān)系,我們把這些 ID 盡可能都收集上來并且去維護它的映射和變更關(guān)系,并且基于收集信息去自建快看的 KKDID。生成快看自己的 ID 之后,我們對設(shè)備的唯一性就有了自己的識別體系,對它的質(zhì)量也有了自己的保證。
② 第二,在建設(shè)的過程中,可以借助行業(yè)內(nèi)的第三方反作弊平臺,利用它的唯一 ID 的識別能力,提升自建設(shè)備 ID 體系的準確性。
我們在 Android/IOS 兩個平臺分別采取了很多判斷邏輯去構(gòu)建自建的 KKDID 體系,在構(gòu)建自己的 ID 體系的過程中,需要做非常復(fù)雜的唯一性識別和判斷。需要平臺根據(jù)自己產(chǎn)品的特點以及收集的用戶數(shù)據(jù),制定適合自己業(yè)務(wù)的定制化判斷邏輯。
下面列出一些快看自建 KKDID 后在公司內(nèi)部的效果,這里只列出重點,我們其實有完整的評估報告:
① 第一,為安卓提升了約 2.2% 的 IMEI 填充率。比如我們有 3 億設(shè)備,里面有一部分安卓,乘以安卓的比例,然后再乘以 2.2%,這部分設(shè)備原來是沒有 IMEI 或者 IMEI 的識別是有問題無法精準匹配的,但是通過唯一 ID 識別,可以把這部分 IMEI 的填充率提升上來。如果有很多重復(fù)設(shè)備被識別成不同的設(shè)備會導(dǎo)致安卓的 IMEI 填充率降低,但是我們通過設(shè)備的唯一識別,可以提升其填充率。
② 第二,對比第三方反作弊平臺,我們的唯一設(shè)備識別率提升了 1.5%。我們行業(yè)內(nèi)的第三方反作弊平臺,他們在設(shè)備唯一識別上也是存在很多 bad case 的,我們在構(gòu)建的過程中發(fā)現(xiàn)了這些問題,即使是行業(yè)內(nèi) Top1/Top2 的反作弊平臺。
③ 第三,我們在搭建了 KKDID 之后,還做了 KDDID 和 IMEI、IDFA、OAID 之間的兩兩映射,提升了各個業(yè)務(wù)在不同場景下使用對接上的準確性。
這是我們解決的第一個問題,也是我們構(gòu)建畫像平臺的一個基礎(chǔ)。首先要能夠精準的識別唯一的設(shè)備,然后才能去對這個設(shè)備進行畫像。
這里重點提了設(shè)備 ID,但不同的業(yè)務(wù)對設(shè)備 ID 的重要性依賴度是不一樣。像很多商業(yè)化,用戶只有登錄后才能進行商業(yè)化的操作,如果對它做精準營銷,只依賴用戶登錄后的登錄 ID 就可以了,反而不那么關(guān)注設(shè)備層面的畫像,所以需要根據(jù)不同的業(yè)務(wù)去思考這個問題。當然,KKDID 是一個通用能力,供大家參考。
(2)實踐 2:數(shù)倉建模經(jīng)驗
?接下來介紹第二個經(jīng)驗,中臺型的畫像平臺對接的業(yè)務(wù)方非常多,會面臨如何管理非常混亂的數(shù)據(jù)源的問題。為了解決這個問題,我們用了分層建模以及數(shù)據(jù)域和主題去分層管理的思路,特點是數(shù)倉有兩個明確的業(yè)務(wù)數(shù)據(jù)域?qū)雍彤嬒裰黝}層兩個明確的分層。
底層的業(yè)務(wù)數(shù)據(jù)域,DWD/DWS 層負責清洗和管理各個業(yè)務(wù)數(shù)據(jù)域內(nèi)的明細層數(shù)據(jù)。以付費域來說,用戶或者會員的付費,我們會在付費數(shù)據(jù)域把付費相關(guān)用戶的行為全部在付費域里面進行建模,然后建不同的寬表進行存儲和管理。對用戶域、流量域甚至其他域都是用同樣思路去建設(shè)的,不承擔直接的畫像計算或者挖掘任務(wù)。
在這之上我們建設(shè)了專門的畫像主題,在數(shù)倉里面對應(yīng)的是 DM/APP 層,承擔著整個畫像平臺的畫像標簽體系的管理,以及標簽數(shù)據(jù)的存儲管理,以及寬表的建模。
畫像主題的數(shù)據(jù)源頭是各個底層的業(yè)務(wù)數(shù)據(jù)域,需要哪一個,可以從管理好的業(yè)務(wù)數(shù)據(jù)域里面對相應(yīng)的數(shù)據(jù)進行提取和應(yīng)用。這樣做的優(yōu)點是業(yè)務(wù)域的數(shù)據(jù)條理比較清晰,畫像主題的數(shù)據(jù)能夠統(tǒng)一管理,實現(xiàn)標簽體系和標簽底層數(shù)據(jù)的統(tǒng)一管理。
這是數(shù)據(jù)的存儲和生產(chǎn)應(yīng)用規(guī)范,能夠在數(shù)據(jù)生產(chǎn)流程中形成這樣一個標準,能夠提升標簽生產(chǎn)的效率。在數(shù)倉建設(shè),比如一些數(shù)據(jù)產(chǎn)品建設(shè)的時候,如果面臨這類問題,解決方案可以通用。
第二個經(jīng)驗實現(xiàn)了對我們畫像平臺標簽生產(chǎn)效率的支撐。?
(3)實踐 3:多業(yè)務(wù)標簽增量融合
?作為中臺型畫像平臺,我們會自己生產(chǎn)標簽,同時各個業(yè)務(wù)線也有基于中臺或者基于自建的數(shù)據(jù)平臺定制化標簽生產(chǎn)的訴求。各個業(yè)務(wù)線生產(chǎn)的標簽?zāi)芊裨诋嬒衿脚_中使用呢?
我們的第三個經(jīng)驗就是能夠支持多業(yè)務(wù)標簽在畫像平臺里面做增量融合。如上圖的左面部分所示,數(shù)倉里面有各個業(yè)務(wù)自己的數(shù)據(jù)域里面的數(shù)據(jù),都做了數(shù)層分層管理和寬表建模的建設(shè),業(yè)務(wù)開發(fā)同學(xué)或者產(chǎn)品同學(xué)基于建設(shè)好的數(shù)據(jù),在業(yè)務(wù)內(nèi)可以做一些開發(fā)和標簽的生產(chǎn)。比如增長業(yè)務(wù)、基礎(chǔ)業(yè)務(wù)或者廣告商業(yè)化業(yè)務(wù),用自己業(yè)務(wù)數(shù)據(jù)域的數(shù)據(jù),生產(chǎn)一些復(fù)雜的定制化的標簽。
在這個過程中,中臺側(cè)可以定義標簽生產(chǎn)和融合的規(guī)范:比如標簽生產(chǎn)的命名、準確性、覆蓋率以及標簽取值(碼值)需要符合哪些規(guī)范;然后標簽內(nèi)容的存儲位置、存儲形式、存儲格式也有一定的規(guī)范。
業(yè)務(wù)線標簽生產(chǎn)完成后,中臺會有對應(yīng)的標簽融合的任務(wù),把業(yè)務(wù)生產(chǎn)的定制化標簽,自動融合到畫像主題。融合之后,還會觸發(fā)標簽的自動化管理,在標簽的體系中,把業(yè)務(wù)側(cè)生產(chǎn)的標簽也融合進去,做統(tǒng)一的管理。
這樣做的優(yōu)點是作為中臺,我們把畫像平臺的標簽生產(chǎn)能力開放給業(yè)務(wù),能夠提升標簽的生產(chǎn)效率,也能夠給業(yè)務(wù)方的開發(fā)側(cè)或業(yè)務(wù)側(cè)進行賦能。?
(4)實踐 4:支持復(fù)合標簽
第四個是偏產(chǎn)品功能上的一個創(chuàng)新。在畫像平臺的迭代中發(fā)現(xiàn),用戶除了對一些簡單標簽的使用之外,在業(yè)務(wù)的精細化運營、精準營銷的過程中,對非常復(fù)雜的標簽的使用是很頻繁的,希望我們能夠?qū)軓?fù)雜的篩選條件做支持,分更多的維度對篩選的用戶做不同維度的計算。
經(jīng)過這部分功能的提煉之后,我們發(fā)現(xiàn)可以通過面向特定業(yè)務(wù)的某一個用戶的行為去做一些符合標簽類型的支持。
上圖左面是我們畫像平臺后臺截的一個比較有代表性的例子,這里的標簽是近 90 天用戶消費和充值明細,它是對用戶近 90 天的行為做了維度的聚合,并且支持把篩選條件也糅合到標簽里面。我們在畫像后臺使用這個標簽的時候,就可以使用該標簽下面特定的條件做篩選,甚至做一些復(fù)雜的篩選條件。比如近 90 天的用戶,他的訂單日期相對于當前時間是大于 30 天的,然后訂單類型是充值類型,貨幣類型是人民幣,對這個人群的標簽,我們希望對它的金額維度做一個求和計算,得出求和后的結(jié)果,這是一個具體的例子。
它的優(yōu)點是提升了標簽計算的靈活性,能夠固化高復(fù)用的復(fù)雜標簽,降低開發(fā)成本。
對數(shù)據(jù)產(chǎn)品來說,需要對業(yè)務(wù)高頻的標簽使用場景有比較好的分析和洞察,才能夠提煉出他對復(fù)合標簽的真正訴求,從而把復(fù)合標簽提煉出來。所以復(fù)合標簽的生產(chǎn)需要,對產(chǎn)品側(cè)的業(yè)務(wù)理解和分析洞察能力要求比較高,但它確實可以大大降低開發(fā)成本,提高標簽的復(fù)用性,在業(yè)務(wù)側(cè)看來這個能力是很方便的,可以對篩選條件和維度做很靈活的篩選和統(tǒng)計分析。
三、快看畫像平臺應(yīng)用案例
下面分享一下快看畫像平臺的應(yīng)用案例,這里分享兩個例子。
1、案例一:助力精準營銷閉環(huán)
第一個案例是助力用戶充值付費業(yè)務(wù)線的精準營銷。精準營銷應(yīng)用畫像平臺之后,流程形成了一個營銷的閉環(huán)。
(1)首先用戶可以基于畫像后臺去做人群包的篩選,對于不同的營銷活動,基于復(fù)合標簽或者特定標簽篩選出人群包。
(2)在運營后臺,對人群包以及投放的特定活動做相應(yīng)的操作配置,運營后臺通過畫像平臺的功能 API 把相應(yīng)的人群包或需要依賴的數(shù)據(jù)拉取到后臺,基于我們營銷后臺的能力,對特定的人群包做特定的分發(fā)和營銷活動的操作展示。
(3)對營銷活動的數(shù)據(jù)進行采集,生成 BI 報表。
(4)運營人員可以根據(jù) BI 報表中的指標數(shù)據(jù)觀察每一個營銷活動效果,根據(jù)效果的反饋,對自己的營銷活動方案或者對人群包去做出相應(yīng)的調(diào)整或優(yōu)化。
這個閉環(huán),在付費會員側(cè)營銷活動中的使用目前已經(jīng)例行化了,也是使用畫像平臺的一個非常重的業(yè)務(wù)。上圖右側(cè)是在畫像平臺截取的一個篩選條件的截圖。
2、案例二:支持內(nèi)容精準宣發(fā)
第二個案例是快看作為內(nèi)容型的平臺產(chǎn)品使用畫像平臺進行內(nèi)容精準宣發(fā)的例子。
精準宣發(fā)業(yè)務(wù)是指什么呢?比如有一個新的漫畫作品,平臺想給其作者一定的扶持,讓它的受眾用戶能夠快速觸達,從而能夠?qū)@個作品產(chǎn)生興趣開始閱讀,給作者和作品積累一定的人氣。
這個操作過去經(jīng)常出現(xiàn)的情況會對所有的用戶做千人一面的分發(fā),所有的用戶看到的是同一個宣發(fā)的作品,這樣的做法,造成很多非受眾用戶也會看到,分發(fā)效率有很大的可提升空間。
使用這個畫像平臺,就一定程度上可以解決這個問題。宣發(fā)運營側(cè)對內(nèi)容精準宣發(fā)的流程是什么?
(1)基于畫像平臺去圈選出特定內(nèi)容偏好人群包。用戶閱讀打分類下的用戶標簽里面會有他的偏好,根據(jù)要宣發(fā)的漫畫作品的品類和特點去匹配相應(yīng)偏好特征的人群包,運營后臺基于畫像平臺的功能 API 去獲取人群包。
(2)在運營后臺的配置中,配上相應(yīng)的人群包和資源位,對該人群包的人群做定向的宣發(fā)。
(3)采集宣發(fā)的數(shù)據(jù),將相應(yīng)的指標可視化。
(4)根據(jù) BI 報表的反饋和分析,驅(qū)動內(nèi)容運營策做出相應(yīng)的調(diào)整和優(yōu)化。
我們畫像平臺的功能是比較通用的,在廣告業(yè)務(wù)場景中以及渠道業(yè)務(wù)場景中,因為業(yè)務(wù)邏輯和流程的鏈路是非常長的,對畫像平臺的依賴會有很多偏定制化的需求。對于這樣的場景,建議在他們的廣告業(yè)務(wù)和渠道業(yè)務(wù)的數(shù)據(jù)平臺中去建立畫像模塊,這個畫像模塊可以和自己業(yè)務(wù)的數(shù)據(jù)產(chǎn)品做很重的耦合,因為它就是服務(wù)于該業(yè)務(wù)的。畫像模塊可以把中臺畫像產(chǎn)品的基礎(chǔ)能力甚至基礎(chǔ)數(shù)據(jù)進行打通應(yīng)用,這樣可以極大提升畫像建設(shè)速度,同時不需要關(guān)注畫像是怎么生產(chǎn),畫像標簽是如何管理的,畫像的功能 API 是怎么樣的,只需使用可依賴的接口,把更多的精力去投入到自己業(yè)務(wù)側(cè)數(shù)據(jù)產(chǎn)品的流程和邏輯中。
四、總結(jié)和展望
最后介紹一下我們總結(jié)的一些經(jīng)驗,以及我們未來的發(fā)力方向。
經(jīng)驗總結(jié)有如下幾點:
(1)中臺型畫像,要重點關(guān)注業(yè)務(wù)側(cè)的通用訴求,做一些通用能力的提煉。
(2)大數(shù)據(jù)平臺、數(shù)倉建模和數(shù)據(jù)挖掘的基礎(chǔ)能力是畫像平臺的基本保障。這些能力是必備的,畢竟一旦涉及到畫像的話,數(shù)據(jù)量會比較大,用戶體量也比較大,對計算能力、數(shù)據(jù)采集、ETL 和建模能力的要求是很高的。使用的越重,這一側(cè)整個全鏈路的要求也會越高。
(3)畫像平臺的核心能力是人群圈選、計算、洞察、復(fù)雜標簽支持、標簽融合體系等。
未來展望有以下三點:
(1)加強標簽的系統(tǒng)性管理,自動創(chuàng)建的效率更高一些,目前有一些人工操作和干預(yù)。
(2)更完善的服務(wù)化能力建設(shè)。服務(wù)化是剛才提到的畫像平臺的功能 API 和查詢 API,服務(wù)的穩(wěn)定性保障以及響應(yīng)及時性都有一些優(yōu)化空間。
(3)實時畫像與離線畫像融合。目前實時畫像的應(yīng)用場景比離線畫像要少很多,但未來實時畫像的應(yīng)用會越來越多,因為現(xiàn)在大家已經(jīng)不太滿足于 T+1 小時這樣的數(shù)據(jù)產(chǎn)出效率了,更希望在分鐘以內(nèi)的延遲生產(chǎn)實時畫像。后面我們會加強實時能力,并與離線畫像進行一些融合。
五、問答環(huán)節(jié)
Q1:底層用戶 ID 生成的規(guī)則能不能分享一下?
A1:由于信息比較敏感,可以大概的說一下。
ID 的生成規(guī)則,最基礎(chǔ)依賴是先要把所有的 ID 收集上來。需要首先和法務(wù)、用戶產(chǎn)品側(cè)去討論可以收集哪些 ID,因為不同產(chǎn)品的定位不同,能收集的 ID 也不一樣。
確定了能收集的 ID之后,需要思考的第二個問題是不同的 ID 的變更頻次也即它的可靠性是怎么樣的?首先安卓和 IOS 是有區(qū)別的,然后安卓和 IOS 內(nèi)部每一個 ID 的變更頻次或可靠性也是不一樣的,這里建議優(yōu)先使用內(nèi)部采集的 ID,對內(nèi)部采集的 ID 優(yōu)先使用可靠性更高、變更頻次更低的。
如果可靠性更高的 ID 是空的或者有問題,再去找次優(yōu)的可靠性低一些的 ID,經(jīng)過這樣的一個優(yōu)先級的次序去逐步判斷每一個 ID 在我們的 ID 庫里面是否存在過,和我們已有的唯一設(shè)備是否有某一個 ID 的重合,這個是做設(shè)備唯一識別的一個很重要的點。
使用內(nèi)部采集的 ID 做完優(yōu)先級的判斷之后,如果我們還采用了第三方的反作弊平臺,最后可以使用第三方反作弊平臺向我們開放他們內(nèi)部的唯一 ID。我們使用他們的內(nèi)部唯一 ID,在我們存下來的外部 ID 里面做去重判斷,對我們自建 ID 的邏輯進行補充。基本上是以這樣流程逐漸的積累。
ID 體系的建立,除了剛才提到的采集和規(guī)則的判斷,很重要的一點就是如何把歷史設(shè)備的信息回溯重建,因為歷史設(shè)備信息也是需要基于同樣的體系構(gòu)建出來的,這是一個難點。
另外就是如何能夠持續(xù)積累,并且唯一 ID 如何能夠在設(shè)備上逐漸提升覆蓋率,只有有了足夠的覆蓋率之后,在公司內(nèi)部才能產(chǎn)生足夠多的應(yīng)用場景,覆蓋度不高的話,很多業(yè)務(wù)沒有辦法直接使用這個唯一 ID。
Q2:快看漫畫平臺是如何防止過度打擾用戶的?
A2:這個很依賴運營策略,體現(xiàn)了運營策略對于精細化的運營是如何理解的。重要的一點就是如何判斷運營策略是有效的,同時也不過度影響用戶。
我自己的一個經(jīng)驗是這樣的,對運營部門的精細化運營策略或者階段性的目標做評估的話,從這個部門的角度,可以建立一個完整的運營策略評估指標體系,而不是只看運營策略的直接效果指標。
比如通過 PUSH 希望能夠提升用戶的點擊率,提升用戶的每天打開人數(shù)。如果只看這個的話,通過 PUSH 頻次的提升,或者對 PUSH 的文案做一些技巧性的優(yōu)化,是很有可能帶來效果的。但是如何減少對用戶的打擾,對 PUSH 的場景來說,需要加一些圍欄指標,就是限制指標,PUSH 不能夠?qū)е聡鷻谥笜说南陆怠1热缬脩魧?PUSH 打開的長留(長期留存),比如接收到這樣 PUSH 消息之后,對用戶 PUSH 的觸達率是否有影響。如果 PUSH 經(jīng)常推垃圾消息或者說很有欺騙性、誘導(dǎo)性的文案,但用戶又感受不到實際的信息和價值,那么他后面可能就把 PUSH 消息接收關(guān)掉了或者說根本不看了,這樣肯定會影響未來的觸達以及 PUSH 點擊的一個長期留存。
所以我建議如果要減少用戶的打擾,我們沒有辦法從全局去求每一個策略都考慮得非常深,而且也不可能盯得太細,但是我們可以用一些圍欄指標去限制運營側(cè)的人員去深度思考后再做出精細化運營策略的制定和執(zhí)行,可能效果會好一些。
Q3:公司從 0 到 1 搭建畫像平臺,標簽體系初期構(gòu)建的時候有什么需要提前注意的點嗎?
A3:我可以大概的積累一下可能會有哪些方面我們踩過的坑。
首先從 0 到 1 去建設(shè),一定會伴隨著你對業(yè)務(wù)的逐步的理解,以及業(yè)務(wù)訴求方面的積累。
如果我們是一個中臺側(cè),對于單個業(yè)務(wù)提的需求,我們需要能夠有一定的宏觀視角去看,它是屬于畫像平臺的哪些能力,或者說標簽體系的哪一部分有這樣的訴求,他的訴求是長期的需求,還是短期的需求。對于我們是要構(gòu)建一個長期的能力支持,還是臨時性的一個支持,這個分析是蠻重要的。這對于我們畫像平臺的一些需求能力的提煉是一個逐漸的積累的過程。前期在對接單個業(yè)務(wù)的時候,從整個數(shù)據(jù)中臺側(cè)我們產(chǎn)品同學(xué)在遇到這類需求的時候,可以適當?shù)目紤]用一些臨時性的方案去支持臨時性的需求,然后業(yè)務(wù)的臨時性需求,有了一定的固定頻次去對接的時候,再去思考如何將它固化下來,以及是否適合固化到畫像平臺里面。
有一個經(jīng)驗就是多個業(yè)務(wù)線里面和用戶相關(guān)的需求,在前期都可以往畫像平臺構(gòu)建的能力上多去思考能不能去做一些支持的。如果單個業(yè)務(wù)有很頻繁的對用戶這方面的一些畫像并且比較固化,畫像平臺的建設(shè)就可以逐步啟動去支持了。
從產(chǎn)品側(cè)我們還需要考慮的一點,大數(shù)據(jù)平臺、數(shù)倉建模和數(shù)據(jù)挖掘基礎(chǔ)能力,是畫像平臺的基本保障。在有了一個通用或者需要固化的需求之后,我們對產(chǎn)品也有了初步的思考和設(shè)計,我們還要從底層思考我們當前有沒有這樣的數(shù)據(jù)能力去支撐我們?nèi)プ霎嬒衿脚_的建設(shè),需要和開發(fā)側(cè)去做方向或者目標的討論,看他們能不能提供相應(yīng)的能力和人員的支持。
這可能是從 0 到 1 搭建的時候,對外以及對內(nèi)的數(shù)據(jù)側(cè)需要討論的。
如果我們屬于業(yè)務(wù)部門,想從 0 到 1 搭建畫像平臺,標簽體系的話有什么要注意的點?我個人覺得如果這個業(yè)務(wù)是有一定規(guī)模的,包括人的規(guī)模以及業(yè)務(wù)體量都比較大的話,才是業(yè)務(wù)線內(nèi)搭建畫像平臺的一個起點或者基礎(chǔ)。在搭建畫像平臺的時候,思路就不是做一個大而全的畫像平臺,可能要先跑一些畫像平臺的功能性的 MVP。畫像平臺哪個能力目前需求是最強烈的,用戶的使用會是最頻繁的,我們先把這個功能性的 MVP 跑通,這是我們業(yè)務(wù)內(nèi)去搭建的一個原則。
在業(yè)務(wù)內(nèi)搭建的時候可以多和運營系統(tǒng)或者數(shù)據(jù)后臺多做一些聯(lián)動,去看看有沒有產(chǎn)品已經(jīng)有了類似的能力或者規(guī)劃,如果有能力有規(guī)劃的話,我們和他們一起去分析,這樣的產(chǎn)品能力在哪做更合適,和哪些平臺打通交互,各自該如何定位。這些討論清楚也是我們從 0 到 1 計劃去搭建畫像平臺的一個基礎(chǔ)。
另外業(yè)務(wù)內(nèi)也非常需要關(guān)注業(yè)務(wù)內(nèi)現(xiàn)有的數(shù)據(jù)能力,我們平臺能力是否足夠完善,否則可能我們做完了產(chǎn)品方面的思考規(guī)劃之后,發(fā)現(xiàn)項目沒法啟動,因為開發(fā)人力或者數(shù)據(jù)基礎(chǔ)是不足的。
這是我覺得起步階段可能需要注意的一些點,包括我們過去也踩過一些坑。
Q4:H5 的 Cookie ID 是否可以作為用戶標識,基于 Cookie ID 的標簽計算是不是有意義?
A4:我們的很多活動都是基于 H5 做的,因為 H5 的開發(fā)短平快,一個活動下線之后也就不再用了,做到 APP 里面成本會高,H5 的開發(fā)效率會更高,迭代速度也會更快。但它的一個問題就是 Cookie ID 的變更會很頻繁,而且 H5 頁面現(xiàn)在會面臨一個難題,現(xiàn)在很多 APP 內(nèi)嵌了瀏覽器,很多 H5 頁面在自己內(nèi)嵌的瀏覽器打開之后,在自己的瀏覽器里面很可能是有特定的 Cookie ID 的,那么對于同一個頁面同一個設(shè)備,我用 UC、用百度、用微信、用釘釘打開,它的 Cookie ID 很可能是有很大差異的,或者根本就不一樣,我們用 Cookie ID 去唯一標識這個設(shè)備的話,幾乎是不可能的。
快看 APP 內(nèi)嵌的 H5,我們有一套機制,H5 和我們安卓 /IOS 做信息接口的打通,把我們設(shè)備層面的 ID 一定要傳到 APP 內(nèi)嵌的 H5 上。這樣,我們內(nèi)嵌的 H5 的活動也好,或者說各種頁面,上報的很多信息,其實都是攜帶了我們的設(shè)備 ID 的,設(shè)備 ID 會比 Cookie ID 的穩(wěn)定性要高很多。甚至我們自建的 KKDID 都可以傳上來,當然這個依賴你們有沒有自建的 ID,它的穩(wěn)定性會更高。
對于很多快看 APP 外的 H5 頁面,沒有我們的設(shè)備 ID 可以獲取。像小程序會好一些,對直接使用它的 Open ID,每個小程序都有自己的 Open ID 體系,都是可以獲取的,作為匿名用戶的一個標識是可以的。
但是對非小程序類的采集就會很難,個人經(jīng)驗,PC Web 或者 H5 頁面,它的用戶的訪問習慣是用完即走的,包括你的活動應(yīng)該基本上也都是短期的。所以我覺得這類活動,我們的目標前期不要設(shè)置成期望用戶多么頻繁,有多么高留存,有次日、7 日、14 日都能夠使用我的 H5 頁面。我們更多的可以在用戶首次訪問的時候,就抓住用戶,激活他的興趣,從而把他引導(dǎo)到我們的 APP,這是可以重點考慮的方向。因為不管是 PC Web 還是 H5,目前所有的數(shù)據(jù)平臺都是一個難題,你包括友盟也好、百度統(tǒng)計也好,他們對于這種 Web 類頁面的用戶識別以及用戶的一個累積,歷史用戶的識別都不重視,也沒有這樣的能力,所以我建議自建數(shù)據(jù)產(chǎn)品的時候,也可以吸取比較好的經(jīng)驗,不用過度的去想 H5 頁面在站外的唯一用戶標識,以及后續(xù)如何長期去做用戶的識別,做精準分發(fā)。我覺得這個可能是一個行業(yè)難題。
Q5:人群效果是針對單個業(yè)務(wù)場景的回收,還是已經(jīng)做了通用功能,所有的場景都能用呢?
A5:對于快看中臺的畫像產(chǎn)品,我們沒有做人群包應(yīng)用效果的 track,因為每個人群包在業(yè)務(wù)內(nèi)的使用場景以及使用邏輯,包括數(shù)據(jù)統(tǒng)計的指標以及報表展示的邏輯都會有挺大差異的,通用能力很難提煉。當然會有一些很基礎(chǔ)的效果的展示,但是我覺得意義并不大,對業(yè)務(wù)來說你給我了我也用不到,我更想看的是這個人群包在業(yè)務(wù)場景中,精細化的每一個關(guān)鍵鏈路的轉(zhuǎn)化漏斗也好,各種人群行為分析也好,做一個更精細深層次的洞察,這不是中臺型畫像產(chǎn)品能提供的,所以我們是沒做這個能力的。
如果想對你們的精細化運營效果做精準 track 的話,根據(jù)快看數(shù)據(jù)中臺產(chǎn)品側(cè)的經(jīng)驗,其實可以從分析師和數(shù)據(jù)產(chǎn)品側(cè)協(xié)作,去把你們特定的營銷活動的整個的數(shù)據(jù)產(chǎn)品側(cè)的邏輯梳理一下,然后用 BI 報表或者說自建報表的形式,把它的整個分析模型以及它的核心指標固化下來,這個可能是一個更有效的一種手段。
Q6:人群精細化運營中人群的覆蓋度和準確率是如何進行平衡的?
A6:這個應(yīng)該是基于精細化運營在業(yè)務(wù)側(cè)應(yīng)用的角度去問我們?nèi)绾稳プ鋈巳喝x,能夠?qū)ξ覀兙毣\營的這些活動或者場景產(chǎn)生更高的準確性,同時就是整體的運營效果會更好。
所謂的精細化運營,他一定會越做越細,我們能夠在我們運營的過程中逐漸發(fā)現(xiàn)人群里面存在的規(guī)律,就是哪一類人有什么樣的規(guī)律,這些規(guī)律會以什么樣的規(guī)則去確定下來這一人群,它是一個應(yīng)該越做越細的過程。
為什么會需要這樣?因為精細化運營如果始終處于某一個用戶運營的力度上,就會眉毛胡子一把,始終在這個力度上,我們對人群的區(qū)分始終不會做得更細。我們很多活動的策略,針對的人群不一定是它非常精準的受眾人群,所以效果可能會存在一定的瓶頸。
我個人的經(jīng)驗就是我們在運營的過程中,對每次精細化運營效果,人群投放效果多做一些分析,為什么有的投放沒有效果,這部分沒有效果的人群和有效果的人群,有一些什么樣的差異。我們找到的差異就是我們下次精細化運營投放的時候,篩選人群包可以多加的規(guī)則,下次投放的時候加上這些篩選規(guī)則,人群的投放會更加的精準,效果也會好一些,轉(zhuǎn)化率也會高一些,業(yè)務(wù)的指標可能也會更高。
這里面又引出一個問題,我們做的越來越細的話,這些人群的一個覆蓋率就變低了,我們活動效果的總 UV 或者說我們的總的 GMV 或者總收入下降了,這也不是我們想要的效果。
能不能平衡?其實我覺得做的越細和覆蓋率指標它不是矛盾的,首先做細的過程中,會逐漸細化出越來越多的人群包,不僅是對原來的人群包加條件讓這個人群包越來越小,而且是創(chuàng)建越來越多精細化的人群包。一個好的方向,用戶存在的特征,我們認識的越來越細,通過這些特征我們篩選的人群包越來越精準,數(shù)量越來越多,當然最好他們之間的重合度會低一些。不同的人群包之間是明顯的特征差異,可以針對他們做更加有效的策略的制定和投放。這樣我們就能夠兼顧用戶人群的覆蓋性以及策略的有效性。
今天的分享就到這里,謝謝大家。