Windows Azure發布HDInsight服務公眾預覽
數據世界瞬息萬變,給現有IT基礎設施帶來了巨大的挑戰,實時產生的海量非結構和半結構化數據讓原有的數據庫架構捉襟見肘。這些數據類型各異,既包括人們在社交網絡上的各種情緒表達,也有地理位置信息,傳感器產生的機器數據,以及自動生成的大量日志記錄等。
如果能善用這些數據,企業用戶就可以得到以往難以企及的關鍵業務洞察。例如,臺灣著名茶點連鎖餐廳“黑丸”將來自零售網點的銷售數據,與人們在社交網絡上對其表達的情緒反饋,以及所在地的天氣信息等數據相結合,發現了能刺激客戶消費的原因。通過將傳統數據源與全新的“大數據”相融合,他們發現,其實氣溫高低并不會影響人們去選擇冷飲或者熱飲,現在他們可以真正從消費者的需求出發對銷售策略做出調整。
類似的應用場景引發了對Hadoop等大數據產品的需求熱潮。作為開源平臺的Hadoop能夠在相對廉價的消費級硬件上,實現海量數據的存儲和處理。Hadoop具有如此強大功能的部分原因在于,其生態系統通過通用的計算模式實現了相同的數據存儲。這種存儲是一種分布式文件系統,其規模能夠從幾個節點擴展至數千個節點,并且全都針對非結構化數據。通過Hadoop與傳統數據結構相結合,用戶能從數據中得到以往難以想象的深入洞察。
但是,在多節點上創建Hadoop集群并非易事,需要有合適的硬件、周密的容量規劃,以及對Hadoop進行設置和部署的專業知識。此外,Hadoop生態系統的快節奏創新也要求IT管理員不斷升級Hadoop軟件或為操作系統打補丁,因此后續的不間斷維護也將成為一大挑戰。而公有云上的Hadoop服務能幫助用戶克服這些挑戰。
由世紀互聯運營的Windows Azure宣布正式提供HDInsight服務的公眾預覽,從而成為***個面向公眾的Hadoop云服務。作為在Windows Azure上運行的Hadoop服務,HDInsight為啟動和運行Hadoop提供了最快捷的方式。用戶無需任何專用硬件或專業知識,只要點擊幾下鼠標,就可以在幾分鐘內建立一個Hadoop集群。用戶還可以根據需要對集群進行擴展,幾分鐘就能將集群從10個節點擴展到1000個節點。此外,用戶還可以在HDInsight上充分利用Apache生態系統中的眾多開源項目,包括HBase NoSQL數據庫、類SQL查詢處理、機器學習等。其中Hive類SQL查詢處理集合了微軟SQL Server技術的Stinger項目,使Hive的查詢性能提高100倍。通過Excel中的Power Query插件,用戶還可以從HDInsight中得到更加直觀的數據洞察。
原文出自:http://tech.china.com/news/yun/11103684/20140918/18798861.html