數(shù)據(jù)分析,根本沒(méi)有你想的那么高級(jí)!
在數(shù)字化轉(zhuǎn)型工作中,十分強(qiáng)調(diào)通過(guò)數(shù)據(jù)科學(xué)技術(shù)來(lái)發(fā)揮數(shù)據(jù)的價(jià)值,例如通過(guò)數(shù)據(jù)分析方法,從數(shù)據(jù)中提取出有價(jià)值的業(yè)務(wù)信息,以此來(lái)提供有效的業(yè)務(wù)應(yīng)用或業(yè)務(wù)決策。在數(shù)字經(jīng)濟(jì)大趨勢(shì)下,數(shù)據(jù)分析這件事,突然之間地位得到了前所未有的提升。
當(dāng)前,為了迎合數(shù)字化的迫切需求,數(shù)據(jù)分析似乎成為一種非常有潛力的技術(shù)能力。如果一個(gè)業(yè)務(wù)人員懂得如何做好數(shù)據(jù)分析,或者說(shuō),掌握更豐富的數(shù)據(jù)分析方法和經(jīng)驗(yàn),那么他似乎也更具職場(chǎng)優(yōu)勢(shì)。
然而,事實(shí)確實(shí)是這樣嗎?
在開(kāi)始從事數(shù)字化轉(zhuǎn)型,或者,牽頭數(shù)字化項(xiàng)目時(shí),經(jīng)常會(huì)覺(jué)得數(shù)據(jù)分析技術(shù)能力很重要,然而,隨著實(shí)踐經(jīng)驗(yàn)不斷積累,接觸的項(xiàng)目多了,逐漸發(fā)現(xiàn),數(shù)據(jù)分析這件事變得有點(diǎn)“雞肋”。
尤其是在技術(shù)層面,總覺(jué)得被一些外在的因素“卡脖子”,由于這些因素的存在,縱然有很多“絕世武功”可以拿出來(lái)過(guò)招,但似乎很少有機(jī)會(huì)真正發(fā)揮出這些技術(shù)方面的優(yōu)勢(shì)。
因此,最終得到結(jié)論——在數(shù)字化轉(zhuǎn)型工作中,數(shù)據(jù)分析或許并沒(méi)有想象的那么高級(jí)。
一般來(lái)說(shuō),數(shù)據(jù)分析有兩種典型的應(yīng)用場(chǎng)景。一是了解現(xiàn)狀,二是發(fā)現(xiàn)未知。
而各種復(fù)雜的數(shù)據(jù)分析技術(shù),以及相應(yīng)的數(shù)據(jù)建模方法,基本上都是為了解決第二類(lèi)需求,即發(fā)現(xiàn)未知,無(wú)論是未知的業(yè)務(wù)知識(shí)、規(guī)律,還是未知的猜測(cè)場(chǎng)景,或未來(lái)趨勢(shì)。
比較尷尬的事實(shí)是,在企業(yè)數(shù)字化實(shí)踐中,我們經(jīng)常發(fā)現(xiàn),大多數(shù)的數(shù)據(jù)是用來(lái)解決第一類(lèi)需求,即了解現(xiàn)狀。
在數(shù)字化應(yīng)用中,往往不需要過(guò)多“花哨”的技術(shù)手段,如果你問(wèn)業(yè)務(wù)人員需要什么,或者問(wèn)領(lǐng)導(dǎo)想從數(shù)據(jù)中看到什么,大多數(shù)的回答基本上都是——某某數(shù)據(jù)統(tǒng)計(jì)結(jié)果能夠及時(shí)、準(zhǔn)確地反饋就好了。最多再來(lái)個(gè)可視化。
不需要建模么?不需要預(yù)測(cè)未知么?僅此而已?
當(dāng)然需要,但是這些更高級(jí)的需求,其實(shí)業(yè)務(wù)部門(mén)對(duì)“數(shù)字化”的期待并不高。
除了在工業(yè)自動(dòng)化相關(guān)領(lǐng)域,如智能制造或智慧城市中的全機(jī)器驅(qū)動(dòng)場(chǎng)景,大多數(shù)企業(yè)在從數(shù)據(jù)資源中推斷、判斷業(yè)務(wù)情況,以及進(jìn)行決策活動(dòng),還仍然遵循著傳統(tǒng)的人工方式。
在數(shù)字化建設(shè)中,除了“取數(shù)”、“統(tǒng)計(jì)”,對(duì)于業(yè)務(wù)人員來(lái)說(shuō),其他需求似乎都不那么迫切。
在進(jìn)行業(yè)務(wù)判斷和決策時(shí),采用機(jī)器建模的方式,被認(rèn)為不那么可靠。
當(dāng)然,導(dǎo)致這種結(jié)果的原因一方面可能是數(shù)據(jù)科學(xué)家并不那么了解業(yè)務(wù),總是構(gòu)建出華而不實(shí)的數(shù)據(jù)模型;另一方面可能對(duì)于一些綜合的、“非線性”的業(yè)務(wù)問(wèn)題,需要考慮的因素和關(guān)系也確實(shí)太復(fù)雜,即便是業(yè)務(wù)人員自己,對(duì)問(wèn)題的結(jié)構(gòu)化難度以及建模難度很大。
最終,業(yè)務(wù)人員選擇出靠譜、順手的一種數(shù)字化應(yīng)用模式就是:機(jī)器來(lái)取數(shù),整合信息,人(靠經(jīng)驗(yàn))來(lái)進(jìn)行分析。這時(shí),數(shù)字化應(yīng)用從外表看是在做數(shù)據(jù)分析,而這種分析只是非常淺層的分析,或者說(shuō),最多只能算是數(shù)據(jù)查詢(xún)、數(shù)據(jù)統(tǒng)計(jì)。
最終,數(shù)字化應(yīng)用需求,大多數(shù)都退化為,以“取數(shù)”為中心的數(shù)字化能力建設(shè)。這類(lèi)需求,在算法上沒(méi)什么難度,技術(shù)創(chuàng)新空間不大,而為了保證“取數(shù)”的質(zhì)量,技術(shù)人員又要花費(fèi)大量的精力對(duì)平臺(tái)進(jìn)行性能上的優(yōu)化,這屬于“純粹”工程上的事情,再不然,就是投入更多的人力來(lái)進(jìn)行數(shù)據(jù)治理,保證“取”到的數(shù)據(jù)結(jié)果可靠。
數(shù)據(jù)分析,沒(méi)有什么算法,也沒(méi)有什么模型。即使有,也只是一些在業(yè)務(wù)上預(yù)定義的函數(shù)、規(guī)則、指標(biāo)。
單純數(shù)據(jù)驅(qū)動(dòng)的方式得到有價(jià)值的結(jié)論,這看似是經(jīng)典的案例場(chǎng)景,但其實(shí)卻是數(shù)字化的未來(lái)理想狀態(tài),目前在大多數(shù)行業(yè)的數(shù)字產(chǎn)業(yè)實(shí)踐中,并不太普及,也不太適用。
未來(lái),數(shù)字化應(yīng)用需要逐漸從以人工分析為主,過(guò)渡到以數(shù)據(jù)分析為主的形態(tài),不斷加大自動(dòng)化、智能化要素比例。很多數(shù)據(jù)分析技術(shù),在數(shù)據(jù)科學(xué)理論上都具有很優(yōu)質(zhì)的應(yīng)用性能基礎(chǔ),因此要?jiǎng)?chuàng)造更有利的條件來(lái)促進(jìn)產(chǎn)業(yè)中的深度數(shù)據(jù)分析活動(dòng)實(shí)踐,具體包括:
- 推動(dòng)業(yè)務(wù)知識(shí)的數(shù)字化編碼,加大數(shù)據(jù)庫(kù)、知識(shí)庫(kù)、案例庫(kù)的數(shù)字化建設(shè);
- 以有經(jīng)驗(yàn)的業(yè)務(wù)人員牽頭,進(jìn)行產(chǎn)業(yè)數(shù)據(jù)模型的研究和開(kāi)發(fā);
- 加強(qiáng)數(shù)據(jù)治理工作,逐步提高數(shù)據(jù)資源的可用性;
- 研究具有可解釋性的、更加“魯棒”的數(shù)據(jù)模型,提高數(shù)據(jù)模型的適應(yīng)性、可調(diào)節(jié)性;
- 推動(dòng)數(shù)據(jù)部門(mén)和業(yè)務(wù)部門(mén)的工作協(xié)同,推動(dòng)跨領(lǐng)域之間的數(shù)據(jù)共享和數(shù)據(jù)融合;
- 推動(dòng)數(shù)據(jù)平臺(tái)建設(shè),低代碼平臺(tái)建設(shè),降低業(yè)務(wù)人員主動(dòng)參與數(shù)據(jù)建模與分析的技術(shù)門(mén)檻。