Hadoop可能已經達到預期的成熟度
五年前,Hadoop用可以解決所有大數據難題的身份殺入主流市場。如今塵埃已經落定,現在是時候對Hadoop展開更切合實際的評估了。
我們現在正處于21世紀第二個十年的正中間。當大數據潮流從五年前開始興起時,Hadoop將***未來這一看法得到了普遍認可。Hadoop市場從那時開始的增長顯示,這一共識并沒有被削弱。持續不懈的宣傳至少為Hadoop的部署與創新打下了良好的基礎。
如果所有人都非常清楚Hadoop的重要性,那么我們是否還有必要在大數據領域中繼續宣傳Hadoop將是“下一個大事件”呢?Hadoop是否早已過了其發展的拐點,其成熟的時間點是否正在快速到來?當所有的成熟標志在細分市場中出現后,我們應該降低它們的市場營銷力度。在大數據分析市場的份額方面,Hadoop目前可能已經達到了之前的預期(盡管整個市場可能還會持續增長)。
為了確定Hadoop是否已經到達了這一拐點,讓我們來評估一下Hadoop目前已經發展到了什么程度,以及未來可能會如何發展。
創業活動是成長型市場的明顯標志。創業活動的下降也是成熟的強烈信號。在經歷了初期的創業活動井噴后,Hadoop平臺、工具和應用廠商已經被人們所熟悉。例如,在近期《InformationWeek》的市場概述中被提及的每一家廠商都是在三、四年前加入這一領域的,當時我還是市場研究機構Forrester的Hadoop分析師。這是成熟市場的一個顯著標志。
Hadoop的另一個成熟標志是,其主要的需求推動因素實際上一直保持著穩定,這反映出其市場一直沒有變化。市場調查的結果也反映出,用戶部署Hadoop主要是用于非結構化數據分析、預測性客戶分析、情感分析等工作。這與我在2011年對Hadoop市場所做的初步研究沒有什么明顯的不同。
細分市場成熟的另一個標志還在于,整個行業在年復一年地重復相同的主題,并將其視為最有效的解決方案。例如,大數據博客仍然在討論“SQL是否在Hadoop生態圈中擁有未來?”等早有定論的問題。答案是肯定的,證據是上述調查中所羅列的每家主要廠商都提供了一系列供備選的SQL訪問/分析選項。
關于“重復相同的舊主題”這一趨勢,這也是Hadoop市場范圍不清晰的毛病。我在2014年4月份曾在一篇專欄文章中指出,Hadoop技術仍然沒有明確的界限(相較于NoSQL,以及其他的大數據方案),而這一點我在三年前供職于Forrester時就已經多次提到過了。時至今日,Hadoop業界的“身份危機”在很大程度上源自其沒有實現標準化,而且沒有統一Hadoop是什么,以及未來的發展前景。
如果認真審視目前Apache軟件基金會給Hadoop作出的定義,我們就會發現,該項目仍然像一個大雜燴,而非一個明確的架構。例如,最近加入到Hadoop中的Spark看起來仍然太過隨意,且其中仍然存在著與Cassandra千絲萬縷的聯系。業界還沒有人真正將Spark作為Hadoop的競爭對手,而非其組成部分。與之形成鮮明對比的是,Cassandra并不是最熱門的開源實時大數據社區,其持續增長的勢頭似乎也已經開始顯著衰退。
當討論越來越多地集中在主流用戶中微不足道的部署率時(+本站微信networkworldweixin),那么就意味著,這一技術的目標市場已經開始飽和。以下才是這份調查報告的核心內容:
《InformationWeek》的數據表明,目前列車尚沒有真正駛離車站:只有4%的企業在廣泛使用Hadoop,而18%的企業表示,僅在有限的范圍內使用了Hadoop……與2014年3%的企業開始廣泛使用和12%的企業僅在有限的范圍內使用Hadoop相比,2015年這兩項數據均有所提升。另有20%企業客戶有使用Hadoop的計劃,不過仍有58%的受訪企業表示,尚未計劃使用Hadoop。
如果大家擁有分析行業的從業經歷,就會發現這樣的狀況有些似曾相識的感覺。二十多年前,BI(商業智能)市場曾經作為獨立業務擁有自己的一片天地,但其在主流知識型員工中的采用率卻一直表現低迷。
也許BI或Hadoop,以及其他大數據技術項目,都注定無法像智能手機那樣被市場所廣泛接受。但這并不意味著Hadoop無法在被明確定義的特定市場之內,發展成為一個極為重要、且盈利可觀的細分市場。畢竟沒有什么東西能夠阻礙一個成年人在步入老年的過程中,逐漸積累到財富與名望。