大數(shù)據(jù)的那些事(1):Google的后悔藥
大數(shù)據(jù)這個(gè)概念紅紅火火的也有兩三個(gè)年頭了,我在這個(gè)坑里的時(shí)間可能要更長一些,勉強(qiáng)可以從08年開始算。所謂年頭待得久了,看得也多一些。對(duì)應(yīng)中國傳統(tǒng)文化的說法,什么東西老了都能成精。這個(gè)坑的主要目的還是以八卦為主,順便把我知道的道聽途說的有的沒的的大數(shù)據(jù)相關(guān)的東西給大家講一講,順便也把大數(shù)據(jù)來龍去脈理一理,權(quán)當(dāng)諸位茶余飯后的談資。倘若寫到精彩之處,還請(qǐng)多多打賞。錢多錢少其實(shí)不是問題,收起打賞就頗有成就感。感覺人生又完整了一些。
大概說起大數(shù)據(jù),我們就不可避免的要談起這個(gè)曾經(jīng)在國內(nèi)風(fēng)光***,然后又從國內(nèi)退出去的公司,號(hào)稱Do not Evil而實(shí)際上相當(dāng)Evil的公司——Google。當(dāng)然,因?yàn)槲冶救说慕?jīng)歷的關(guān)系,我在自己公眾號(hào)前面的文章里也提到過,我是黑軟粉,不是和主流大眾的審美觀一致。
不可否認(rèn),大數(shù)據(jù)伊始,主要是因?yàn)镚oogle這個(gè)公司。更加確切的說,不僅僅是因?yàn)镚oogle的一系列的論文,更是因?yàn)镚oogle以自己的一年又一年的財(cái)報(bào)告訴大家,免費(fèi)的消費(fèi)者們,結(jié)合大數(shù)據(jù)的技術(shù),做成廣告平臺(tái),就像開了印鈔機(jī)一樣。錢之所在,趨之若鶩,人性本來就是如此。
我們把時(shí)光倒流到2009年,經(jīng)濟(jì)危機(jī)的時(shí)候。那一年全世界發(fā)生了很多事。除了大家開始狂印鈔票以外,大數(shù)據(jù)作為一個(gè)概念也開始悄然登場了。這個(gè)時(shí)候我曾經(jīng)聽到一個(gè)特別著名的笑話。笑話大致上是說,有人采訪了Larry Page,問他有沒有什么后悔的事情,Larry Page說,他很后悔讓MapReduce和Google File System這樣的paper給發(fā)了出來。
這個(gè)采訪估計(jì)是子虛烏有的東西,然而其反應(yīng)的本質(zhì)問題,Google后悔了,卻是非常真實(shí)而有據(jù)可循的。在我看來,Google不僅僅是后悔了,而且是在不停的后悔又后悔之中。所以當(dāng)一個(gè)新的名詞人工智能,以及伴隨著的AR/VR出現(xiàn)的時(shí)候,Google采取了一種截然不同的做法。今天我們從Google的后悔藥說起。
Google的后悔藥的***層意思其實(shí)非常的名曲,倘若Google早年沒有發(fā)表了Google File System, MapReduce,以及BigTable這三篇文章,那么Google依然擁有著這世界上最為先進(jìn)而獨(dú)特的大規(guī)模數(shù)據(jù)存儲(chǔ)和計(jì)算的能力。而業(yè)界的其他公司如果要想平地起高樓的起起來,那可能會(huì)需要更多的時(shí)間。Map
這其實(shí)從Google發(fā)表的一系列文章里也能看出來。Google File System是論文里面的經(jīng)典,必須說每個(gè)做數(shù)據(jù)處理的人都值得一讀。MapReduce則寫得沒那么實(shí)誠了。等BigTable出來的時(shí)候,那就更需要讀者更多的想象空間了。至于此后若干年才誕生的Spanner,這個(gè)系統(tǒng)也許可以稱為是一個(gè)偉大的系統(tǒng),這篇論文,寫得遮遮掩掩的那種樣子,能被OSDI接收也是奇跡,更何況是Best Paper Award呢。
就事論事,Google從一個(gè)非常開放的方式到越來越保守,和它后悔自己泄露了自己的商業(yè)機(jī)密,而以后又不得不繼續(xù)以泄露商業(yè)機(jī)密的方式來半遮半掩的顯示它在大數(shù)據(jù)領(lǐng)域的存在,無疑說明Google其實(shí)很后悔一開始發(fā)了那幾篇論文,可惜這世界上并沒有后悔藥。
然而我覺得Google其實(shí)是一個(gè)商業(yè)上極其失敗的公司。倘若我做CEO的話,估計(jì)高marketing的應(yīng)該從上到下都清幾遍。為什么這么說呢。Google這個(gè)公司有著天生的優(yōu)越感:老子就是有Google File System,老子還有MapReduce,你們這些老朽的,還有新生的公司們,沒有我這樣牛逼的體系結(jié)構(gòu),你們搞什么飛機(jī)都沒辦法趕得上我。所以呢,Google這個(gè)作為奠定了整個(gè)BigData最開始的框架和基礎(chǔ)的公司,從來都沒有想過開源自己的系統(tǒng),以便可以占領(lǐng)市場。
于是活雷鋒Yahoo上場,硅谷大大小小的公司都湊上去,亂拳打死老師傅。
Hadoop這樣的一個(gè)看起來很爛的系統(tǒng)就這樣在大家七拼八湊的節(jié)奏下搭出來了。然后就茁壯成長起來了。這是一件非常有意思的事情。作為大數(shù)據(jù)技術(shù)的奠基人,在大數(shù)據(jù)領(lǐng)域的影響力,基本上是等于零。那么大一塊餅,你Google只要自己open一點(diǎn),本來很大的市場,現(xiàn)在是做了雷鋒卻沒撈到任何的好處,我想Larry Page回頭想起來,估計(jì)后悔藥吃的不止是一瓶。
除去商業(yè)上極其的傲慢以外,Google還是一個(gè)以自我為中心的公司。Jobs的偉大在于他說過用戶是愚蠢的我們要告訴用戶怎么用才是正確的,這話的前提是Jobs的確是非常的比用戶更知道他們需要的是什么。盡管蘋果有諸多弊端,對(duì)用戶的真實(shí)需要的理解是很深刻的。
Google不同,每次都是不切實(shí)際的指望用戶去按照他們的方式去用他們的產(chǎn)品。早年的Google玩的那個(gè)只需要瀏覽器就可以讓消費(fèi)者訪問全世界以及完成日常所有應(yīng)用的Chrome應(yīng)該是一個(gè)很好的例子。然而在大數(shù)據(jù)這個(gè)背景下,和云計(jì)算相關(guān)的地方,Google做了一件事:Google App Engine。非要定義的話,這是個(gè)PAAS的東西。Google2008年正式開始做這個(gè)App Engine,進(jìn)入云計(jì)算市場,并且提供了包括BigTable在內(nèi)的API的支持。問題吧,Google大概忘記了它自己和它的用戶的不同。
它的系統(tǒng)的Scalability對(duì)大部分用戶來說,都沒意義,沒有什么用戶要用幾萬臺(tái)電腦去解決問題的。而它的API的局限,對(duì)很多用戶來說其實(shí)無法接受。最簡單的,Google當(dāng)時(shí)并不支持join。并且Google告訴大家我自己這么大的公司就沒有用Join,你們也不需要用。
Google App Engine折騰幾年,并不成功。相反的微軟亞馬遜都開始做賣虛擬機(jī)的生意,而且越來越紅火,所以到了12年終于忍不住開始做Google Compute Engine,也就是終于承認(rèn)自己以前的戰(zhàn)略錯(cuò)誤,開始賣機(jī)器了。我相信4年時(shí)間可以做很多事情,我也相信4年時(shí)間足夠讓一個(gè)本來可以搶占一部分蛋糕的市場,變得無足輕重起來。所以說西雅圖才是云的中心,而彎曲,包括Google在內(nèi),終究是慢了。我想Larry Page肯定是非常的感嘆他接二連三的做出的錯(cuò)誤決定。這些錯(cuò)誤決定的唯一結(jié)果就是BigData這塊大蛋糕,基于Google的論文,但是卻沒讓Google吃到一口。
所以當(dāng)人工智能這個(gè)新泡泡起來的時(shí)候,Google迅速采用了一個(gè)完全不同的策略,不僅僅用AlphaGo這個(gè)程序告訴大家,所謂圍棋,不管東亞人怎么吹是信仰是人生是哲理,其實(shí)無非就是個(gè)計(jì)算的問題。Google接下來很快的開放了Google內(nèi)部的人工智能平臺(tái)TensorFlow。我想這個(gè)戰(zhàn)略上的轉(zhuǎn)變,反映了Google不想在人工智能這個(gè)新的熱點(diǎn)上再一次吃上BigData上面顆粒無收的后悔藥。
同系列之: