為什么你的數據倉庫項目推進不下去?
本文轉載自微信公眾號「木東居士」,作者木東居士 。轉載本文請聯系木東居士公眾號。
為什么你的數據倉庫項目推進不下去?
0x00 前言
最近很多小伙伴都來找居士咨詢類似的問題:
- 我的數據倉庫規范設計的很好,為什么大家卻不執行?
- 數據倉庫規范推著推著,感覺項目就涼了,不能持續?
- 老板看不到數據倉庫的價值,不再投入人力了。
不同的團隊會面臨不同的難題,今天居士簡單聊一下這幾年自己親身經歷以及幫助一些小伙伴解惑后的一些感想。
廢話少說,直接上正題。分為三個角度討論:
- 體系搭建
- 業務理解
- 溝通管理
這三個角度,也是我認為一個每一個數據倉庫項目負責人要具備的核心能力。下面分別從這三個角度進行分享。
0x01 體系搭建能力
說句心里話,大部分互聯網公司的數據倉庫,其實是不需要特別復雜和專業的數據模型的。
因此,大家要先有足夠的信心去認為,你按照設計出來的數據倉庫體系,是能cover住大部分業務場景的。此處可以去參考居士之前的數據倉庫文章。
那么,為什么還要提這個體系搭建能力呢?
這里想強調的是,你對于數據倉庫整體的規劃和思考能力。切記不要紙上談兵,搞一堆什么模型,什么分層,其實沒有什么用的,不能真正解決問題的設計,都是假的。
拋開這些模型之類的亂七八糟的角度來看,居士舉幾個例子,這些例子其實能解決你很多問題,而這些方案帶來的效率提升,就會讓你能感覺到數據倉庫的帶來的價值。
記住一點,不要指望一種表設計能滿足100%的需求,如果有,請告訴我。
一、Bitmap表
舉個例子,用戶活躍Bitmap表。
表結構:
- ds:日期
- uid:用戶id
- day_act_bitmap:01010010101010,1表示當天活躍,0表示某一天不活躍
這么一張表,在day_act_bitmap字段里面存放用戶的歷史活躍情況,能滿足絕大部分關于活躍統計的需求。
如果感覺不夠,再在里面補充幾個維度,再加個周活躍,年活躍,這不就ok了?
二、用戶維度行為寬表
表結構:
- ds:日期
- uid:用戶id
- 場景1的活躍次數
- 場景2的活躍次數
- 場景3的活躍次數
這么一張用戶維度的寬表,又能幫你滿足一大波需求
三、業務統計大寬表
類似前面的,不再解釋了。
這種設計還有很多,就不一一列舉了~
這些設計都不是多么嚴謹的模型設計,但是很有用,也能解決很多問題。大家可以把這些小trick整合到數據倉庫模型設計中。
有了真正能解決業務需求模型能力之后,就是如何讓大家執行了。特別是規范制定后大家不遵守該怎么辦?一般有下面幾種方式:
- 制定可執行的規范,一定是可操作的,不要搞太虛的,比如大家可以思考一下,自己的數據分層設計,能否明確兩個層次的的具體差別是什么?能否做到可以不用思考按照規范就能確定分層
- 通過流程&管理手段保證執行
- 化系統化強制執行,不遵守不能建表,不能寫入數據
具體用哪種方式就看具體的場景了。在大部分團隊的前期,居士推薦前兩種結合。
0x02 業務理解能力
拋開業務設計的數據倉庫模型,都是在耍流氓。
這一塊有挺多想說了,想了想也不知道該說什么了。簡單聊一下換位思考吧。
假設你是一個業務產品經理。
假設你是一個數據分析師。
假設你是一個推薦算法工程師。
回過頭看一下自己的表結構設計,靠譜不,合理不。
如果體會不到,就去找一些關系好的同事,看看他們在你的數據基礎上做了多少工作才能讓數據可用?多聽一下吐槽。
為什么要做這些?
當你的用戶對你的產出不滿的時候,你做的東西是沒有價值的,沒有價值的東西是不能長久的。
所以,具備良好的業務理解能力是保證你的數據倉庫項目能順利推進下去的核心動力。
0x03 溝通管理能力
前段時間做過一次分享,提到了一個觀點:如果一個項目失敗了,90%的鍋都應該在項目經理這里,而這90%的因素里面,至少有90%是因為溝通問題。
根據溝通的對象,可以把溝通問題劃分為下面幾個方面:
- 向上溝通
- 向用戶溝通
- 向成員溝通
思考一下:
- 你多久和老板同步你的項目進度?
- 你多久暴露一次你的項目風險?
- 你的用戶和老板是否認同你的項目價值?
- 你的項目成員是否能從你的項目中收益?
- 你的項目成員是否愿意跟著你干事情?
- 你是否定期組織項目團建?是否定期畫餅?
- 你的項目有成果了,是否帶上了項目成員?
- 你是否有請外部的數據倉庫專家來進行授課? 相信我,專家意見,尤為重要!
上面這些是大部分同學的數據倉庫項目推進不下去的過程中會遇到的問題。
拋開上面這些容易看到和關注的點,還有下面這些內容大家是否考慮到?
- 你的數據倉庫項目,是否損害某些相關方的利益?
- 你的數據倉庫項目,是否從某個側面在diss某些同學的設計不合理?
如果考慮到了,該如何去解決?是否有經驗?
以上都是溝通問題。
關于管理的問題暫時就不多提了,參考項目管理即可,關于項目管理的內容大家可以去考一個pmp的證書,證書沒什么用,主要是學一些東西,再結合互聯網的特色應用起來即可。
0xFF 總結
總結一下吧,從居士的角度來講,當你的數據倉庫項目推進不下去的時候,優先考慮的是溝通的問題,良好的溝通能解決大部分的困難。
優秀的業務理解是決定你的成果能被其他人接受的可能性。
最后,適當且合理的體系搭建能力,能助力你顯得更優秀。