終于,做出一個高質量的數據分析項目
大家經常找我感慨:“忙來忙去,感覺都是常規數據報表,連個拿得出手的項目都沒有!”那到底高質量的數據分析項目該咋做?
怎樣算高質量
想回答這個問題,得先明確:啥叫“高質量”項目。從本質上看,數據分析是個支撐型崗位,工作質量高不高,主要由被服務的部門決定。如果是在企業里工作的話,主要看管理層/業務部門的評價意見。如果在面試時,則主要由面試HR/用人領導評價。摸清對方的需求,擊中對方的痛點才是關鍵。
經常有同學在這里犯迷糊,覺得:用了線性回歸模型的(復雜的模型不會)/圖表blingbling閃光的/查一個數sql 寫了2000行的,才算是“高質量”,忽視了這些玩意對業務到底有沒有用,結果自然是鬧笑話了。
前幾天還有個同學急匆匆來問,說他們建了流失用戶預測模型,結果運營表示:“你們搞這干啥?預測了我也不知道咋用!”然后項目就黃掉了……這就是典型的閉門造車結果。
那要怎么弄,才能切中業務痛點呢?
找準核心需求
數據分析對業務,是個“隨風潛入夜,潤物細無聲”的事,往往有數據看的時候大家不覺得很厲害,但是沒數據看了,就有人會著急。
所以想找到業務的痛點,最好不要強行推銷:“我有一個人工智能阿爾法大狗子模型,百測百準,客官您要不要試試!”而是先看,對方部門最關注什么問題,最缺什么數據。
常見的缺數據的情況有四種:
1、基礎數據都沒有,迫切想看到數
2、有數據但不知道怎么解讀,干著急
3、有數據,有解讀,想進一步驗證想法
4、有數據,有解讀,想進一步做預測
接業務方需求的時候,一定要清晰真實需求。比如“用戶畫像”,可能上項目時就是嘴上一說,到底是業務不清楚用戶現狀,還是想基于畫像做啥動作,一定要了解清楚。項目開始時不清晰,中間過程也要逐步清晰,不然哼哧哼哧打了一堆標簽再被人質疑“你這有啥用!”那就是啞巴吃黃連了……
報表型項目的要點
報表型項目數量最多,但最容易被數據分析師們忽視,很多新人總嫌棄它技術上不復雜。但實際上,報表型項目是最容易出成績的,關鍵在于:做領導們關心的,領導們看得見的。接需求的時候,區分報表使用人,優先把領導們需求做可視化,讓領導們直觀感受到數據。
并且,通過報表型項目,可以有效鑒別業務方合作態度。如果業務方態度好,那么可以深入合作。既然已經有了業務監控報表,那么下一步就可以做業務走勢異常分析。
先記錄非業務主動行為產生的異常點,之后再深入分析:
- 多大幅度變化算異常
- 是什么因素導致的異常
- 如何通過數據提前發現異常
有了這些積累,就可以進一步做自動化異常提醒+問題診斷,讓單純的數據展示更上一層樓,同時能為后續深入分析打好基礎。
分析型項目的要點
在很多人原始印象里,數據分析就應該是拿到一堆數字,然后般若媽咪哄一通分析,告訴業務三句話,讓業務多賺18萬!因此往往人們對分析型項目期望甚高。
但實際上分析型項目特別容易踩雷。對業務不夠了解,缺少監控數據,缺少異常分析的經驗,都會讓問題分析流于表面。做項目時“雷聲大、雨點小”是常態。
因此,分析型項目在報表型項目基礎上孵化出來,成功率比較高。如果發現業務方對問題本身監控不足、認識不清,可以退回到報表型項目做起。有了一定積累后,想見效,最好的辦法是先共識業務假設,搞清楚業務方到底對啥沒信心,對啥有信心。證偽比證真容易,直接驗假設更容易出結果。
如果問題涉及太多難以量化的疑難雜癥,還有個解決思路,就是把問題轉化成測試型項目。直接看業務方手頭有什么解決問題的辦法,然后測試哪種辦法管用。這樣也能輸出解決問題的方案。
測試型項目的要點
測試型項目相對容易成功,本質上看,測試也屬于“業務沒數據,特別想看個數據”的情況。只不過要注意的是,到底要測啥,得事先想清楚了。在測試中最重要的就是:對影響結果的因素有前期了解,測試想測的關鍵因素,控制其他干擾項。
因此,一般頁面設計測試容易成功,對消費結果測試容易亂套。因為頁面設計測試點少,容易出準確、穩定的結果。但影響消費結果的因素太多了在做測試之前沒想清楚,很容易因為測試方案之間可比性不高,參與測試群體差異大,關鍵干擾因素沒排除等原因導致結果失靈。
所以,在做測試前,基礎分析工作是很必要的,梳理清楚到底哪些因素會有影響,幾套測試方案之間差異點到底有多大,能有效提升項目質量。
預測型項目的要點
預測型項目的關鍵在于:確認真實的預測需求,避免盲目賭命式的“我要100%精確”。不但做不到,而且沒意義。
比如開篇講的流失用戶預測,如果運營是全量投放資源召回流失用戶,那把目標改成預測:“哪些人自然會回流”這樣就能節省經費。如果運營想獲取最大效果,可以把目標改成:“用戶預計響應哪種方式的召回”這樣可以做多輪推送最大化喚醒用戶。
總之,先搞清楚運營的計劃再下手,比自己閉門造模型管用得多。