專訪IBM硅谷實驗室大數據項目總監Steven Sit
【51CTO獨家特稿】在2012 IBM軟件技術峰會上,51CTO記者有幸對IBM硅谷實驗室大數據項目總監Steven Sit進行了專訪。就大數據在自然災害預防,IBM未來在大數據技術方面的遠景,數據分析師人才培養方面進行了充分的交流。
左為IBM硅谷實驗室大數據項目總監Steven Sit先生(51CTO攝)
北京的一場大雨讓人們看到了自然災害的巨大破壞力,災害之后我們應該反思如何提升預防能力。如同Steven給我們分享的那樣,IBM大數據項目已經開始在地震預報方面有了進展。可以將更多的數據進行整合,這種平時記錄大量“平安”信息,關鍵時刻記錄災害信息的模式,IBM稱之為動態大數據。透過大數據分析技術,我們可以對未來的情況進行預測和疏導。這對災害發生后的快速反應,應急疏散減少損失有巨大的幫助。
大數據的軟硬件一體化方案已經越來越多,這樣的方案對于企業來說可以節約相當大的一部分精力。談到IBM在大數據軟硬件一體化方面,Steven表示IBM未來將會有相關的項目研究。
在Steven上午的演講中,提到了大數據平臺主要功能,即
***,大數據平臺必須有海量分析的能力。在這方面我們是很認同Hadoop System,Hadoop和它的EcoSystem。
第二,大數據很多時候會產生流量的數據,所以我們需要一個流計算的平臺或者引進。
第三,針對傳統性很密集,而且是結構性的數據,我們需要一個大型的、并行的數據資料庫,這也是我們最近收入了Netezza的一些功能。
第四,剛才說到80%的數據是非結構性或半結構性的,在這些文本的分析功能方面,我們需要有索引的功能。
在***層,我們當然需要一些信息整合和信息管理,來加強平臺的安全性、整融性。而在這些引進的上層,我們加了一些針對不同應用的加速器,而在最上面我們有一些不同的工具,針對與我剛才所說的數據科學家、開發人員、管理人員的不同開發工具。針對不同行業的加速器,我們將在今年年底和明年推出一系列針對不同行業,像電信、財務、公共交通、零售業、媒體業的一些加速器。
更多內容,請參閱本次專訪視頻。