2017年,塑造大數據行業的五大趨勢
越來越復雜的大數據需求意味著創新的壓力仍然很高。許多公司開始明白,客戶的成功離不開數據方面的工作。不利用數據分析的公司會開始歇業,而成功的企業認識到發展的關鍵是數據精煉和預測分析。
本文通過Forrester的數據分析,總結了2017年大數據產業的幾大趨勢,與諸君分享。
Forrester的預測數據
Forrester在一份最新的報告中說,2020年之前,使用人工智能(AI),大數據和物聯網(IOT)等技術開展新業務的企業,每年將比不使用這些技術的同行多賺1.2萬億美元。
在所有業務中,2017年人工智能的投資將同比增長300%以上。通過復雜系統的高級分析和機器學習技術得到智能認知,AI將為企業用戶提供強大的、以前從未有過的洞察。Forrester表示,通過幫助縮小從洞察到行動的差距,AI能夠在營銷,電子商務,產品管理以及其他領域推動用戶做出更快的業務決策。
人工智能、大數據和物聯網技術的結合將使企業能夠投資并成功使用它們,以克服數據訪問障礙并挖掘有用的信息。在2017年,這些技術將增加業務的數據訪問,擴展可分析的數據類型,并最終提高洞察的成熟度。大數據技術將趨于成熟,供應商也越來越多地將其與傳統的分析平臺集成,這將有助于將其獲得的廣泛信息納入現有的分析流程中。使用單一架構來實現大數據與靈活可操作洞察的融合將變得更加廣泛。
Forrester預計,可提供物聯網洞察能力分析的第三方供應商在2017年將翻一翻。這將鼓勵他們的客戶投資更多的網絡設備并挖掘分析其產生的數據。例如,Forrester發現,67%的電信決策者正在考慮或優先考慮在2017年開發物聯網或M2M(機器/人與機器/人的交互)計劃。
Forrester表示,增加對物聯網的投資將帶來新型的分析,這反過來也將帶來新的業務洞察。目前,許多由邊緣設備(如手機,可穿戴設備或汽車)產生的數據被直接丟棄。而實際上,這些數據可以被當作“不成熟的數據”并進行分析實踐,這導致很多企業浪費了這些洞察的機會。
在2016年,不到50%的數據分析決策者采用了位置分析。Forrester預計,到2017年底,采用位置分析的企業將增長到三分之二以上。
2017年將出現的三大可喜現象
由于客戶正是通過產品和服務來與所處的世界進行聯系,因此,新型分析產生的新洞察將使企業更好地優化其客戶體驗。Forrester看到了很多令人歡欣鼓舞的跡象,越來越多的公司制訂了用于消除客戶信息壁壘的投資計劃,這將使他們能夠更好地協調和提高整個企業的洞察力。具體來說,Forrester表示在2017年將看到以下三個可喜現象:
1、首席數據官(CDO)職位將成為常態化
到2017年,首席數據官(CDO)職位將成為常態化,而在2016年,大概只有46%的公司設立了CDO職位。但是要真正成為一家洞察驅動型企業,企業必須由首席信息官(CIO)和首席營銷官(CMO),甚至CEO負責部分數據業務,以便根據數據驅動洞察的結果迅速推動業務行動。
2、客戶數據管理項目將增加75%
2016年,39%的企業首次實施了大數據計劃,通過跨渠道跟蹤,了解并熟知用戶的使用習慣,洞察用戶的深入需求,從而為用戶提供定制化的服務。還有近三分之一的企業表示計劃在未來十二個月內采用大數據技術提供解決方案。
3、采用洞察力驅動的企業將顯著增加
Forrester預計,隨著企業在2017年實現數字化轉型,在企業范圍內采用洞察力驅動的實踐將顯著增加。率先采用客戶智能實踐和戰略的企業將成為業務轉型的典范。長期來說,基于人工智能的服務和應用最終會改變大多數行業并重新分配勞動力。
2017年,塑造大數據行業的五大趨勢
1.物聯網(IoT)
公司日益期望從所有數據中獲得價值,企業組織將不得不改動技術,以便與物聯網數據銜接起來。這在數據治理、標準、健康保障、安全和供應鏈等方面帶來了無數新的挑戰和機遇。
物聯網和大數據是同一枚硬幣的兩面,數十億與互聯網連接的“物件”將生產大量數據。然而,這本身不會引發另一場工業革命,不會改變日常的數字化生活,也不會提供拯救地球的預警系統。來自設備外部的數據才是企業讓自己與眾不同的方面,結合上下文來捕獲和分析這種類型的數據為公司帶來了新的發展前途。
2.深度學習
深度學習主要用于從大量未標記/未監督的數據當中學習,因而對于從大數據中提取有意義的標識和模式頗具吸引力。比如說,它可以用來識別許多不同類型的數據,比如視頻中的形狀、顏色和對象,或者甚至是圖像中的貓,就像谷歌研制的一個神經網絡在2012年所做的那樣。因此,企業可能會看到更多的注意力投向半監督式或未監督式訓練算法來處理進入的大量數據。
3.內存中分析
不像常規的商業智能(BI)軟件對存儲在服務器硬盤上的數據運行查詢,內存中技術查詢的是載入到內存中的信息,這可以通過減少或甚至消除磁盤輸入/輸出瓶頸來顯著提升分析性能。就大數據而言,正是由于TB級系統和大規模并行處理,讓內存中分析技術更令人關注。
在現階段,大數據分析的核心其實是發現數據。要是沒有毫秒級延遲,面對數百萬次/數十億次的迭代,運行迭代以查找數據點之間的關聯就不會成為現實。在內存中處理的速度比磁盤上處理要快三個數量級。
4.云計算
混合云和公共云服務越來越受歡迎。大數據成功的關鍵是在彈性基礎設施上運行(Hadoop)平臺。我們會看到數據存儲和分析趨于融合,帶來新的更智能的存儲系統,它們將經過優化,用于存儲、管理和排序龐大的PB級數據集。展望未來,我們可以預計會看到基于云的大數據生態系統將繼續迎來發展,不僅僅局限于“早期采用者”。
5.Apache Spark
Apache Spark在點亮大數據。流行的Apache Spark項目提供了Spark Streaming技術,通過主要采用一種在內存中微批量處理的方法,近實時地處理數據流。它已從Hadoop生態系統的一部分,變成許多企業青睞的一種大數據平臺。