一個(gè)案例,教你掌握數(shù)據(jù)分析最關(guān)鍵的5個(gè)思維
數(shù)據(jù)分析在互聯(lián)網(wǎng)公司的重要性不言而喻,隨著社會(huì)對數(shù)據(jù)分析人才需求量的增大,越來越多的人在朝數(shù)據(jù)分析的方向發(fā)展。但很多人談到數(shù)據(jù)分析時(shí)首先想到的是數(shù)據(jù)分析工具,如Python、SQL等,卻忽略了數(shù)據(jù)分析思維的培養(yǎng)。
數(shù)據(jù)分析思維決定了從哪些方面分析,而數(shù)據(jù)分析工具主要是服務(wù)于數(shù)據(jù)分析思維。簡單地說,數(shù)據(jù)分析思維決定了分析方向,而數(shù)據(jù)分析工具只是幫你達(dá)到目的地。
一個(gè)連分析的方向都搞不清楚的人,即使通過數(shù)據(jù)分析給出了一些結(jié)論,這些結(jié)論也很難讓人信服,因?yàn)檫@些一般都是片面的,當(dāng)然更談不上對業(yè)務(wù)的指導(dǎo)。
本文我就通過一個(gè)案例來教大家掌握五個(gè)關(guān)鍵的數(shù)據(jù)分析思維。
案例:某電商公司最近一個(gè)月的GMV環(huán)比增長10%,但本月用于銷售的成本支出卻環(huán)比增長50%,分析GMV環(huán)比增長率低于銷售成本增長率的原因。
一、 因素分解法
因素分解法,顧名思義,就是分解影響目標(biāo)的因素。
案例中,影響GMV的因素可以從多個(gè)維度拆分:
- 渠道維度:總體GMV=渠道1 GMV + 渠道2 GMV +…+渠道n GMV
- 城市(子公司)維度:總體GMV=城市1 GMV + 城市2 GMV +…+城市n GMV
- GMV = 訂單量*客單價(jià)
- 訂單量 = 活躍用戶數(shù)*下單率
- 活躍用戶數(shù) = 新增活躍用戶數(shù) + 活躍的老用戶數(shù)
顯然,訂單量、活躍用戶數(shù)、新增活躍用戶數(shù)、活躍的老用戶數(shù)等每一個(gè)因素都可以再分解到渠道和城市維度,而每個(gè)城市也可以再分解到渠道維度。這就是交叉因素分析法。
每一個(gè)因素的變化如何分析呢?這就需要用到對比法。
二、 對比法
對比法主要有環(huán)比上期、同比去年同期兩個(gè)比較基準(zhǔn),當(dāng)然也可以根據(jù)業(yè)務(wù)情況,確定其他比較基準(zhǔn)。
對比法可以發(fā)現(xiàn)數(shù)據(jù)變化的規(guī)律,并且增長率可以定量反映數(shù)據(jù)變化情況。不同時(shí)期的同比增長率可以對比,環(huán)比增長率也可以再對比。
如案例中,若同比去年,發(fā)現(xiàn)去年11月GMV的同比增長率為20%,而今年的同比增長率只有5%,顯然今年11月份的增長率同比去年11月份變低了。
提到對比,不得不提到值得注意的一點(diǎn):趨勢固然重要,但不要只看大致趨勢,要分析具體的變化比率。數(shù)據(jù)分析不是告訴別人差不多,而是要告訴別人差多少。
三、 分類法
在分解了影響目標(biāo)的因素,并分析了各因素指標(biāo)的增長率以后,我們可以發(fā)現(xiàn)有一些城市、業(yè)務(wù)單元或者其他對象(如用戶)多個(gè)關(guān)鍵指標(biāo)都表現(xiàn)比較好,或者其中一個(gè)關(guān)鍵指標(biāo)表現(xiàn)好,但其他指標(biāo)表現(xiàn)差。對這些對象我們需要進(jìn)一步分類,區(qū)分出高價(jià)值對象、重點(diǎn)發(fā)展對象、重要挽留對象和一般維持對象。
如案例中,我們進(jìn)一步分析發(fā)現(xiàn):部分用戶下單頻率很高,客單價(jià)也很高;部分用戶下單頻率比較低,但客單價(jià)很高;部分用戶下單頻率很高,但客單價(jià)低;還有部分用戶下單頻率和客單價(jià)都很低。
對以上四類用戶,我們可以用最簡單直觀的四象限法分類:

在上述四象限分類的基礎(chǔ)上,我們還可以加入第三個(gè)維度,最近一次消費(fèi)時(shí)間距今的天數(shù),以判斷用戶可能流失的概率(最近一次消費(fèi)時(shí)間距今的天數(shù)越長,越容易流失),這就是常用的RFM模型。
四、 二八分布法則
有一個(gè)玩笑說:如果一種數(shù)據(jù)的分布不服從常見的正態(tài)分布、泊松分布、二項(xiàng)分布的話,那它就接近服從二八分布了。
這個(gè)玩笑雖然不一定百分之百能概括所有的數(shù)據(jù)分布類型,但在我們常見的與錢相關(guān)的數(shù)據(jù)分布中,很多都服從二八分布。如:世界上20%的人掌握了80%的財(cái)富,一個(gè)公司20%的客戶貢獻(xiàn)了80%的收入,一個(gè)公司20%的員工為企業(yè)發(fā)展貢獻(xiàn)了80%的力量……
二八分布法則對數(shù)據(jù)分析師的啟示是:重點(diǎn)研究貢獻(xiàn)80%的收入的20%用戶,找出這些用戶的特征,再把其他潛在用戶培養(yǎng)成這20%的用戶,企業(yè)就可以越做越大了。所以,作為一名數(shù)據(jù)分析師,先集中精力把這20%的重要用戶研究清楚,再研究其他用戶吧。
通過以上四種思維方法,你已經(jīng)把案例中下過訂單、貢獻(xiàn)收入的用戶基本分析清楚了。
但除了下過訂單的用戶,還有一部分用戶是沒有下過訂單的,這部分用戶為什么沒有下過訂單呢?
我們需要通過漏斗法來分析用戶從登錄平臺到最后下單的轉(zhuǎn)化率。
五、 漏斗法
漏斗法主要目的是查看目標(biāo)事件整個(gè)過程中每一步的轉(zhuǎn)化率以及整個(gè)事件最終的轉(zhuǎn)化率,發(fā)現(xiàn)用戶流失最嚴(yán)重的環(huán)節(jié),以優(yōu)化程序和提高整體轉(zhuǎn)化率。如:產(chǎn)品使用過程中每一步的轉(zhuǎn)化率,可以幫助分析產(chǎn)品設(shè)計(jì)環(huán)節(jié)的優(yōu)劣;運(yùn)營活動(dòng)每一步的轉(zhuǎn)化率,可以分析運(yùn)營活動(dòng)各個(gè)環(huán)節(jié)設(shè)計(jì)的優(yōu)劣。
漏斗法在互聯(lián)網(wǎng)公司的數(shù)據(jù)分析中經(jīng)常被用到,并且經(jīng)常通過埋點(diǎn)數(shù)據(jù)分析頁面曝光和點(diǎn)擊的PV、UV。
在案例中,電商漏斗可用如下圖表示,注冊、登錄一般是新用戶才有的環(huán)節(jié),對老用戶而言則是啟動(dòng)、瀏覽商品直至最后支付成功的環(huán)節(jié)。
電商用戶登錄-支付成功漏斗圖

當(dāng)然,漏斗中每一步的轉(zhuǎn)化率指標(biāo)同樣需要結(jié)合前面提到的對比法進(jìn)行分析,如分析同一時(shí)期轉(zhuǎn)化率的變化情況,對比分析不同城市或用戶群體每一步的轉(zhuǎn)化率等。
最后,每一種數(shù)據(jù)分析思維不是孤立存在的,需要結(jié)合交叉使用,以發(fā)現(xiàn)問題和解決問題為最終目的。