剖析:為什么我們應(yīng)該殺死“大數(shù)據(jù)”?
老實(shí)說我以前是一個經(jīng)常濫用大數(shù)據(jù)這個詞的人,似乎每一個新成立的企業(yè)都與大數(shù)據(jù)有關(guān),就連風(fēng)險投資公司也更愿意投資關(guān)于大數(shù)據(jù)的公司。
為什么我現(xiàn)在越來越不喜歡“大數(shù)據(jù)”這個詞了?因為我認(rèn)為這個詞條本身是落伍的,它的定義由一系列的單詞構(gòu)成,但這些單詞并沒有正確的反映了目前數(shù)據(jù)界發(fā)生了什么。現(xiàn)在,我們應(yīng)該考慮的不是“大數(shù)據(jù)”,而是應(yīng)該想一想我們能用數(shù)據(jù)做些什么。這些與運(yùn)用分層數(shù)據(jù)創(chuàng)建的應(yīng)用有關(guān),也與這些應(yīng)用能體現(xiàn)的深層意義有關(guān)。我不是第一個對大數(shù)據(jù)的夸夸其談感到厭煩的人,我與大量的投資者、數(shù)據(jù)專家以及企業(yè)家聊過,很多人與我有同樣的感受。
根據(jù)Vincent Mcburney的說法,“大數(shù)據(jù)”一詞起源于賓夕法尼亞大學(xué)的Francis Diebold,他在2000年7月寫的一篇關(guān)于金融建模的文章中首度提及此詞。從那時到現(xiàn)在已經(jīng)超過了10年的時間,在此期間關(guān)于人們該如何運(yùn)用大數(shù)據(jù),發(fā)生了太多的事情。

大數(shù)據(jù)不僅僅只與大企業(yè)有關(guān)。事實(shí)上任何一個公司,從Facebook、Twitter這種巨人公司到Cloudera、Box、Okta這種快速發(fā)展的創(chuàng)業(yè)公司都是大數(shù)據(jù)公司,依照大數(shù)據(jù)的定義來看。每個有著一定用戶規(guī)模的公司都在搜集大量的數(shù)據(jù),也就是“大數(shù)據(jù)”。在一個數(shù)據(jù)是產(chǎn)品創(chuàng)新關(guān)鍵的世界,成為一個“大數(shù)據(jù)”公司并不算什么獨(dú)特的事,老實(shí)說一點(diǎn)都不能說明一個公司的具體狀況。
根據(jù)IBM,大數(shù)據(jù)包括四個方面:數(shù)量、速度、多樣化以及真實(shí)性。在這個充滿了社交網(wǎng)絡(luò)、電子商務(wù)以及企業(yè)數(shù)據(jù)存儲的世界,這些因素在許多領(lǐng)域都有被應(yīng)用到。大數(shù)據(jù)真的不能代表全部,既然我們有這么多不同的方法來篩選及使用這些大量數(shù)據(jù)的話。
這并非是低估在整理、分析大量數(shù)據(jù)方面創(chuàng)新的重要性。事實(shí)上,許多產(chǎn)業(yè)的未來,包括電子商務(wù)與廣告,都要依賴于對數(shù)據(jù)的處理。像GoodData、Infochimps、Moat等這些創(chuàng)業(yè)公司,都在研究讓數(shù)據(jù)能更好的為人所用的方法。
另一點(diǎn)值得指出的是,在大數(shù)據(jù)這個詞發(fā)明之前,像IBM、大型零售商、金融巨頭等大型企業(yè)就已經(jīng)開始在分析大量數(shù)據(jù)上面花時間了。所以讓我們思考出另外一種方式來描述需要處理大量數(shù)據(jù)的創(chuàng)業(yè)公司吧,或許是和應(yīng)用的實(shí)際功能與數(shù)據(jù)的對比有關(guān)。