數據分析方法和思維—5w2h
本文轉載自微信公眾號「DS數據科學之美」,作者YYloveYQ 。轉載本文請聯系DS數據科學之美公眾號。
01寫在前面
首先謝謝懵懵冰, 粽子, 王松, Spring, 李思宏 ,大力 等(排名不分先后)轉發文章讓更多人看到
在數據分析的面試中, 你是否不止一次遇到以下的問題:
- DAU降低了, 怎么分析,
- 用戶留存率下降了怎么分析
- 訂單數量下降了怎么分析
像這樣的問題, 如果沒有科學的思維框架去梳理你的思路的話, 去回答這個問題我們就會有一種想要說很多個點, 但不知道先說哪一個點, 只會造成回答很亂, 沒有條理性, 同時有可能會漏斗很多點
回答這種分析的類似的問題的時候, 大多數情況下都可以利用5w2h 的方法幫助我們去組織思路, 這樣可以在回答這種類似的問題的時候, 可以做到邏輯清晰, 答得點縝密完善
比如DAU下降了, 5w2h 分析法會教你如何拆解DAU下降以及歸因以及給出建議
比如用戶留存率下降了, 5w2h方法會教你去拆解用戶, 歸納不同群體的留存率下跌原因
比如訂單數量下跌了, 5w2h 方法助力漏斗分析, 快速挖掘流失的關鍵步驟, 關鍵節點
02什么是5w2h
5w2h 分析法主要是 以五個W開頭的英語單詞和兩個以H開頭的英語單詞組成的, 這五個單詞為我們提供了問題的分析框架
5W的內容
1.What-發生了什么?一般用來值得是問題是什么, what 的精髓在于告訴我們第一步要認清問題的本質是什么
2.When-何時?在什么時候發生的? 問題發生的時間, 比如dau 下降了就是下降的具體時間分析, 這個時間是不是節假日等等
3.Where-何地?在哪里發生的? 問題發生的拆解其中一個環節, 還是dau 下降了, 是哪一個的地區的下降了, 是哪一個功能的使用的人下降了等等
4.Who-是誰? 比如dau 下降了, 就是是哪一部分的用戶群體在降, 是哪一個的年齡, 性別, 使用app 時長等等
5.Why-為什么會這樣?dau 可能降低的原因猜想, 比如某個地區的dau 降低了, 其他地方的沒有降低, 那可能是這個地區的app 在使用的過程中有什么問題
2H的內容
1.How-怎樣做?知道了問題是什么以后, 就到了策略層了, 就是我們要采取什么樣的方法和策略去解決這個dau 下降的問題
2.How Much-多少?做到什么程度?這個主要是比如dau下降了以后, 我們采取對應的策略是可能花費的成本是多少, 以及我們要解決這個降低的問題解決到什么程度才可以
035w2h在實際案例中的應用
1.背景:
某APP的付費人數一直在流失, 如何通過數據分析去幫助產品和業務去挖掘對應的付費的流失原因并給出對應的解決策略
2.分析思路:
嘗試用5w2h 分析法去拆解這個問題
what: 我們的問題是付費人數開始流失了, 這種流失應該就是表現出來同比和環比可能都是下降的
when: 整體的流失很難看出問題, 所以我們需要去分析不同的流失周期的用戶的占比大概都是多大, 從而分析出現在付費用戶的流失周期主要集中在哪里。
where: 付費的入口和不同付費點的分析, 主要是分析哪一個入口的付費人數流失嚴重或者哪個功能的付費人數流失嚴重, 挖掘關鍵位置
who: 對用戶的屬性和行為進行分析, 分析流失的這部分用戶群體是否具有典型的特征, 比如集中在老年群體, 集中在某個地區等等, 行為的特征分析表現在流失的用戶的行為活躍表現是怎么樣的, 比如是否還在app 上活躍, 活躍的時長和天數等等的分析
why: 通過上面的分析, 就可能大致得出用戶的流失的原因, 需要把數據結論和猜想對應起來去看, 并做好歸納總結
how: 當我們挖掘和分析出付費用戶流失的原因了以后, 需要采取對應的策略去減少流失的速度, 同時針對流失的用戶進行挽留和召回
how much: 在通過數據分析給出對應的策略的時候, 也需要幫助業務方去評估我們的策略大概需要的成本, 讓業務方知道這個策略的可行性以及價值
3.分析過程:
(1) 不同用戶的流失周期比例分析, 大部分的群體的流失周期還不是很長, 說明整體來說用戶的流失是最近剛發生的, 同時流失的周期不長, 說明我們有能力可以針對這部分的流失用戶利用策略進行挽留
(2)不同付費入口的拆解分析
對比付費的四個主要的入口, 分析每天的付費人數的走勢, 發現付費人數的減少主要集中在我的tab 入口, 我的tab 入口的付費降低的可能原因是什么呢
這就需要拉上業務方一起去分析對應的原因, 比如是可能是這個位置的付費功能的具體流失的每一個環節的流失情況(結合漏斗分析一起去看)
分析出我的tab 頁面中 付費功能具體的流失環節, 然后再針對性的進行調整迭代
(3) 用戶特征分析
這里以年齡為例, 分析流失的付費用戶的年齡特征, 發現主要集中在18歲以下的未成年群體, 這部分的用戶群體為什么流失呢? 就需要結合用戶反饋等一起去看
除了年齡的角度, 我們還可以分析流失的用戶的性別特征, 城市級別特征, 活躍時長和活躍天數, 經常使用的功能等特征
(4) 原因總結歸納
通過分析, 付費的用戶群體主要原因是我的tab 的付費功能引起的, 可能是具體的某個付費轉化環節出現問題
流失的用戶群體主要是18歲以下, 男性, 三線城市為主(假設)
流失的用戶群體活躍時長, 活躍次數, 活躍天數等沒有明顯下降
(5) 策略落地
這個環節需要和業務方反饋我們的數據分析結論, 然后結合產品的經驗以及用戶反饋以及調查問卷等方法進一步確定原因
如果確定好是我的tab 中付費功能的某個環節出現問題, 就需要針對的進行改進, 同時上線小流量的ab test 去驗證我們的策略是否有效
04總結
5W2H分析方法從問題出發,有一套科學完整的分析思路,對造成問題的原因進行推測,并提出相應的解決方案,最終解決問題,形成閉環。
當然,理論很美好,在實際應用過程當中可能還會遇到各種各樣的業務場景,針對不同的業務場景, 整體的框架還是不變的, 但分析的維度就需要根據不同的產品形態和業務特性來調整。