做大數據項目最頭痛的是什么
必須祭上甲方看了沉默,乙方看了流淚的詩集:《項目五怕》
相當多的“大數據”“數據挖掘”“人工智能”項目,是因為甲方某部門老板迎合上意,追趕潮流才上線的。反正大老板喜歡,管他有什么業務場景,管他有什么商業價值先干起來。這種項目如果運氣好,趕上公司業績高漲,可能負責人可以平步青云,把屁股留給下一任擦。如果運氣不好,趕上公司業績下降,就會連負責人帶項目一起掃進垃圾堆。
這就是所謂的吉祥物項目。作為乙方,如果腦子一熱跟著當吉祥物,很有可能連尾款都收不回來。因為本質上講,數據類項目很難直接產生價值,需要結合到某個業務場景。所以上項目之前,為項目找個出路是必須的功課。
過氣網紅變垃圾,沒有實際應用場景,應用不夠剛需,場景不夠重要,最后項目下場都好不到哪去
一個搞笑的說法是:業務部門眼中excel透視表處理不了的問題都算大數據。加之這幾年營銷號猛烈鼓吹,造成了很多業務部門對“大數據”“數據挖掘”“人工智能”產生了不切實際的幻想。如果需求是業務部門提的,就得特別思考:他們提的到底是個什么需求?這個需求有沒有條件去做?數據能幫到多大程度?
如何梳理需求,展開寫一本書都夠了,這里只提示一些常見問題:
- 心口不一,口頭問題和實際數據是兩碼事。
- 好高騖遠,期望值遠超過IT實際能力,又不舍得投錢。
- 期望過高,指望數據能創造奇跡。來個“大數據”一搞,庫存就不積壓了,客戶就接電話了,風險就沒了,業績就有啦。
這些問題,來自業務部門被各路營銷號洗腦太深,自己又不懂技術。在談需求的時候,業務部門寫在紙上的一個標點符號都得確認一下。從一開始就控制期望值,找到合理的落地方式,才是跳坑正解。
提到數據清洗,有意思的是:相當多的臟數據是人為弄出來的。最典型的,比如在超市購物,收銀員問句:“有會員卡嗎?”你說:“沒有”,他就不管了……這看似一點點疏忽,導致很多商超數據關聯到顧客ID的不足10%,這么差的數據基礎,除了訂單分析以外還能整什么分析?丟掉90%數據建出來的響應模型又有啥用?
更不要說什么渠道操縱業績,假卡、鬼卡、幽靈卡,羊毛客等等問題。我就遇到過某銀行業務員教我:“這里您就填年薪10w不要多也不要少!”的事。實際上,數據化管理做得好的公司,本身管控力與執行力都很強。如果一個公司管控力不足,那做數據項目的同仁們,在許諾數據項目質量的時候,就得嘴下留情了。
最終,數據項目想推動業績增長,是需要業務部門配合的。如果是營銷類項目,需要產品、廣告、促銷費用;如果是生產類項目,需要操作手冊、工作流程、作業培訓、執行規范。這是個很淺顯的道理:再好的狙擊鏡也得射手扣扳機才能打死敵人。
然而很多業務部,不是太過迷信數據,就是太過輕視數據。迷信數據的,諸如:“都有精準推送了為什么還要好產品?都有定向營銷了為什么還要投促銷?”輕視數據的,諸如:“總部懂個屁,我們自己干!”如此這般,空有數據,沒有落地,數據的價值如何體現?
綜上,啟動項目前至少要落實五個問題。其實我個人并不是正兒八經的大數據開發,然而這些年太多項目都掛個“大數據”的頭銜,以至于我也被拖下水了。所以處理具體需求時會格外謹慎。這兩年大數據淡了,人工智能又開始喧囂了,各位同仁繼續打起精神警惕起來哇。
然而,現在大量的新人也在助長這種風氣。做模型不考慮業務場景,找一個清洗過的數據包,不合適的數據直接丟掉,然后一味追求在測試集跑出來的準確率。似乎不需要了解業務給個數據包就能有95%了,于是就有了第五怕:
是滴,老兵們都知道做項目水很深。如果需求是IT部提的,那還相對靠譜,至少有懂技術的人幫我們過濾了一次。但如果是業務部門,就真的得打起12分精神。然鵝,新人們往往腦子一熱就上了,還喜歡什么復雜上什么。結果嗎, 要么被虐的服氣,要么被虐的離職。正所謂:新鬼煩冤舊鬼哭。剛入行的同學們不被虐過幾次,是很難體會到個中滋味的。
我常舉得一個例子,即使通過簡單的描述性統計,也能對所謂精準營銷的前景進行初步估算。不要小看描述性統計哦,除了做個直方圖算個頻數,它是快速接近業務,發掘坑點的重要手段
吐槽歸吐槽,說到底,還是想提醒大家做項目時貼近業務的重要性。因為本質上,數據工作是個專業人士服務業余人士的工種。正如同醫生給病人看病,醫生都是博士以上飽讀詩書,可病人卻是三教九流各式各色。大部分病人,就是進門只會哼哼:誒呦,誒呦,難受,難受。這時候就得耐心診斷病情,而不是說我有個阿爾法素,一針下去藥到病除不是。