數(shù)據(jù)倉庫的下一階段該是什么?
在大數(shù)據(jù)時代,大家都意識到數(shù)據(jù)已經(jīng)成為了公司寶貴的資產(chǎn),但如何讓數(shù)據(jù)發(fā)揮價值,一直困擾著大家。數(shù)據(jù)技術人員需要長時間去理解某一個業(yè)務,業(yè)務人員也很難使用現(xiàn)代化數(shù)據(jù)分析工具賦能業(yè)務。那么,如何讓公司數(shù)據(jù)能夠快速和業(yè)務融合起來成為了廣大數(shù)據(jù)從業(yè)者和數(shù)據(jù)服務廠家一直以來思考的問題。
01數(shù)據(jù)賦能業(yè)務的”攔路虎“
回想起Hadoop從2006開始獨立發(fā)展,到現(xiàn)在已經(jīng)16年了,這些年來涌現(xiàn)出了很多數(shù)據(jù)技術棧,從數(shù)據(jù)接入存儲,到數(shù)據(jù)計算分析,可以說是百花齊放。
但在數(shù)據(jù)融入業(yè)務的過程中,逐漸也顯現(xiàn)了一些問題。
我們經(jīng)常會聽到這樣的聲音:
“你先提交一個數(shù)據(jù)需求流程吧,我們評估一下開發(fā)工作量,排期開發(fā)。”
“這個不是我開發(fā)的問題,你提的這個指標和小李提的統(tǒng)計邏輯不一樣啊”
“李老師,你說的這個指標定義中的XX是什么意思呢,這個數(shù)據(jù)源從哪里取值?”
“今年我們這邊的預算已經(jīng)用完了,以后再提數(shù)據(jù)需求,需要你們單獨對我們進行結算的。”
那么我們?yōu)槭裁磿?jīng)常有以上這些“抱怨”,總結一下,無非以下幾點:數(shù)據(jù)開發(fā)流程長、數(shù)據(jù)統(tǒng)計口徑不一致、技術人員與業(yè)務人員協(xié)同困難、開發(fā)運維成本高。
這就導致我們數(shù)據(jù)開發(fā)人員,永遠都有做不完的“提數(shù)”需求,數(shù)據(jù)產(chǎn)品永遠有開不完的會,到了年底還要寫數(shù)據(jù)為公司創(chuàng)造多少業(yè)務價值。
02數(shù)據(jù)人的掙扎
資深的數(shù)據(jù)人當然知道現(xiàn)在數(shù)據(jù)賦能業(yè)務中的“攔路虎”,同時也做了一些嘗試。
優(yōu)化數(shù)據(jù)開發(fā)流程
完整的數(shù)據(jù)開發(fā)流程具備以下6個階段:提出階段、設計階段、開發(fā)階段、測試階段、發(fā)布階段、運維階段。
以前,也許我們會在不同平臺進行各個階段的管理,比如數(shù)據(jù)建模是用的1個工具,數(shù)據(jù)開發(fā)1個工具,數(shù)據(jù)測試一個工具,現(xiàn)在我們搭建了統(tǒng)一的數(shù)據(jù)平臺,形成了設計開發(fā)測試流水線的工作形式。
業(yè)務需求接口人
建立業(yè)務需求接口人,涉及某個領域的數(shù)據(jù)需求,統(tǒng)一由改角色向數(shù)據(jù)團隊提交開發(fā)申請。
技術融入業(yè)務
要求數(shù)據(jù)開發(fā)人員定期和業(yè)務共同辦公,了解整個業(yè)務流轉過程,提升對業(yè)務的理解能力。
降低成本
從技術上建立冷熱數(shù)據(jù)存儲機制,優(yōu)化壓縮算法,建立數(shù)據(jù)生命周期等。
可以說,在某些方面,確實讓數(shù)據(jù)開發(fā)人員輕松了一些,但是數(shù)據(jù)賦能業(yè)務價值真正提升了嗎?
03數(shù)據(jù)賦能業(yè)務的探索
數(shù)據(jù)中臺
數(shù)據(jù)中臺前幾年很火,最近溫度好像降了下來。回溯一下,當初提出來數(shù)據(jù)中臺這個概念是為了實現(xiàn)數(shù)據(jù)的分層和水平解耦,提供全域的數(shù)據(jù)服務。主要包括以下4部分:數(shù)據(jù)資產(chǎn)、數(shù)據(jù)治理、數(shù)據(jù)模型、數(shù)據(jù)服務。
數(shù)據(jù)模型,就是我們熟悉的數(shù)據(jù)倉庫中的模型,按照數(shù)據(jù)倉庫規(guī)范分層開發(fā)模型,實現(xiàn)數(shù)據(jù)的標準化。
數(shù)據(jù)資產(chǎn),在數(shù)據(jù)倉庫中我們已經(jīng)建立了一些模型,但是只有打通數(shù)據(jù)孤島后才可以稱為資產(chǎn)。
數(shù)據(jù)治理,為了保障數(shù)據(jù)資產(chǎn)的完整性、準確性、一致性、及時性,為業(yè)務提供統(tǒng)一的、準確的指標保駕護航。
數(shù)據(jù)服務,提供統(tǒng)一的數(shù)據(jù)服務在線查詢視圖,讓開發(fā)者能夠快速、簡單的訪問數(shù)據(jù)服務。
數(shù)據(jù)倉庫是“管理數(shù)據(jù)”,數(shù)據(jù)中臺是“經(jīng)營數(shù)據(jù)”,數(shù)據(jù)中臺是為了提供服務而生,也有說是為了前臺而生,數(shù)據(jù)中臺的使用對象仍然是開發(fā)人員。
對于一個企業(yè)來說,業(yè)務人員才是“規(guī)則制定者”,只有讓業(yè)務人員自己把數(shù)據(jù)指標用的“得心應手”,才能真正的實現(xiàn)數(shù)據(jù)賦能。那么一個面向業(yè)務人員的,“零門檻”操作的數(shù)據(jù)指標平臺,將會成為企業(yè)實現(xiàn)全面數(shù)字化轉型的必選項。
指標中臺
現(xiàn)代管理學之?彼得·德魯克有?句?常經(jīng)典的話:“What gets measured gets done”,意思是只有一件事情能被量化,才能夠被解決。就好?家?有了?臺秤,才能衡量減肥的效果。那么如何量化管理企業(yè)呢,這個統(tǒng)?的標準去衡量業(yè)務,就是指標的由來。
所以,從業(yè)務經(jīng)營角度來看,指標可以衡量業(yè)務發(fā)展的情況,也為未來業(yè)務方向的決策提供重要的支撐,指標中臺的主要使用對象是業(yè)務人員。
面向業(yè)務人員的平臺,很多數(shù)據(jù)人也都做過嘗試,比如很多“數(shù)據(jù)自助分析平臺”,在推廣過程中經(jīng)常會聽業(yè)務人員說“你這個工具還沒我的Excel好用”。所以,面向業(yè)務人員使用的平臺門檻一定要低。就要能達到現(xiàn)在普通人使用手機數(shù)碼相機就能像專業(yè)人員用單反相機拍出一樣漂亮照片的效果。
結合我們現(xiàn)階段數(shù)據(jù)賦能業(yè)務遇到的問題,指標中臺應該能夠具備以下4個特點:?效協(xié)同管理、業(yè)務敏捷提升、數(shù)據(jù)?徑?致、開發(fā)成本降低。
?效協(xié)同管理,用戶可創(chuàng)建 Goals(目標),并通過多層級的目標結構來管理指標,形成指標體系,實現(xiàn)管理的可觀測性,完成從數(shù)據(jù)到管理決策的閉環(huán)。
業(yè)務敏捷提升,業(yè)務人員可以使用無代碼、低門檻的指標管理平臺,借助平臺自動化構建指標能力和行業(yè)指標模板,快速迭代賦能業(yè)務。
數(shù)據(jù)?徑?致,建立統(tǒng)一指標目錄,使得組織能夠輕松定義和管理指標,形成統(tǒng)一的指標口徑,并進一步通過治理,增強數(shù)據(jù)的可信度。
開發(fā)成本降低,業(yè)務人員自助創(chuàng)建、復用指標;數(shù)據(jù)團隊擺脫繁重的 ETL 工作,只需聚焦指標管理;企業(yè)人效大幅提升。
04指標中臺的展望
指標中臺并不是要完全替代數(shù)據(jù)倉庫,二者是集成與合作的關系。數(shù)據(jù)倉庫作為指標中臺的上游數(shù)據(jù)源。所以從階段上來說,建議從業(yè)務角度明確所需要的業(yè)務指標,然后接入數(shù)據(jù)倉庫的數(shù)據(jù),并在指標中臺中定義和管理指標。那么,數(shù)據(jù)處理平臺和指標中臺之間的協(xié)作也需要更加便捷。
對于AI方面的支持,現(xiàn)在很多業(yè)務除了需要指標,還需要進行一些AI方面的深度數(shù)據(jù)挖掘分析,就像以前我們ETL任務都是離線的一樣,隨著數(shù)據(jù)技術的發(fā)展和業(yè)務的需求,有了越來越多的實時流處理任務。那么,對于指標中臺來說,提供全方面的AI分析能力需求也會變得越來越多。
生態(tài)的建立,任何技術平臺的使用推廣,需要建立相應的行業(yè)生態(tài),否則會很難進行推廣。有了生態(tài),才會帶動業(yè)務上下游一起來使用平臺,逐漸形成標準,也許會發(fā)展成為“行業(yè)中臺”,這樣的話,對于整個行業(yè)的業(yè)務賦能和效率提升意義就更大了。