數據倉庫2.0分析應用將變得普遍
分析數據庫是為報表、儀表板和即席查詢等提供業務數據從而驅動商業智能運作的主要引擎。
雖然分析數據庫不可或缺,但在商業智能產業最近幾年掀起的一體化狂潮中,很大程度上已經忽視了分析數據庫的重要性。在以比比皆是的數據倉庫為核心的世界里,這些數據存儲器僅僅被看作是輸送導管,而不是區分不同平臺的組件。最近在供應商意愿的帶動下,絕大多數商業智能的一體化都以增強商業分析應用,或向商業智能平臺添加更先進的可視化、搜索和其他面向數據訪問等特性為目標。
不過,分析數據庫在未來的幾年里肯定會成為評定一個商業智能解決方案優劣的關鍵區分指標。隨著核心商業智能特性商品化的趨勢,越來越多的供應商會將速度、可擴展性、高通量和對混合負載的支持這些只有調試良好的高級分析數據庫才能提供的特性作為自己的軟件產品與別不同的賣點。
每一個商業智能軟件供應商都會夸耀自己的分析數據庫能夠比其競爭對手的產品處理更多并發用戶,能夠執行更多復雜多維查詢,能夠更迅速地加載批量數據,能夠進行更復雜的計算密集型轉化,能夠管理更大規模的數據集。同樣,他們還會展開價格戰,鼓吹自己產品比對手的產品性能更加全面且更加物美價廉。
在越來越商品化的商業智能市場里,分析的性價比成為了主要的購買指標。這種趨勢帶動業界日益重視分析設備的發展,也就是商業智能設備或數據倉庫設備的發展。
事實上,大多數領先的商業智能供應商,如SAP(包括Business Objects)、IBM(包括Cognos)、甲骨文、微軟和SAS等,都有向市場提供自己的分析設備,也有的正在自行研發或和合作伙伴一起開發基于這類分析設備的產品。
雖然這些供應商會繼續提供商業智能和數據倉庫解決方案作為軟件包產品,不過他們都已經看準了客戶需求的方向——將分析設備作為總體解決方案具有很大的吸引力。特別是中型市場客戶,對這類設備的興趣非常濃厚,他們認為這些設備能夠為他們提供快速部署預先優化的解決方案,并解除了技術人員匱乏的負擔。
隨著分析設備成為企業商業智能戰略的核心,數據倉庫設備將依靠自己的技術特性進化成為完全成熟的商業智能平臺。Teradata、惠普、Netezza、Greenplum、DATAllegro、Dataupia和ParAccel等設備供應商都將擴展其執行“數據庫內分析”的能力,并自行研發、或與合作伙伴和客戶一起開發其他的應用。
設備供應商們會在數據庫特性優化技術上一決雌雄,如索引技術、分區技術、內存緩存技術、壓縮技術、立方體技術、斷詞(tokenization)技術和查詢計劃優化技術等等用來管理各種分析任務的技術。而且,所有的設備供應商都會通過大規模并行處理、集群技術、任務管理以及其他的特性來強化其硬件的可擴展性。
此外,面向列數據庫(一種非常適合于數據密集查詢處理的存儲機制)的供應商,如果不能重新圍繞應用設備調整其市場準入戰略,就會完全被分析市場所淘汰。
具備優化過的硬件的面向列數據庫比只有軟件的競爭對手具備非常明顯的性能優勢,以致于后者恐怕不得不將原有的市場份額拱手相讓。此外,雖然大多數設備供應商避免使用面向列的存儲方式,而更傾向于將傳統的面向行的關系數據庫管理系統用來進行多維聯機分析處理,但他們會將這種存儲技術作為備用技術為將來進一步提升性能所用。
市場對價格低廉而功效顯著的分析技術日益增長的需求也將促進基于訂閱模式的數據倉庫服務的發展,這種模式也稱為DW 2.0、數據庫2.0、云數據庫(cloud database)或按需數據庫(on-demand database)。微軟雖然不是第一個登上這個新技術舞臺的角色,但在這個舞臺上卻是表現最為突出的一個,已經在近期推出了SQL Server數據服務(SSDS)的有限測試版,并預計在2009年全面投放市場。在SQL Server數據服務中,微軟將SQL Server關系數據庫管理系統功能的一個子集用來支持分析和事務應用。雖然微軟還沒有特別地為分析而優化SSDS,不過微軟已經表示將會向這個方向發展這項服務。
隨著越來越多的服務供應商開展DW2.0服務,DW2.0時代將不斷的出現價格更低廉,分析能力更強勁的服務。在未來十年內,軟件即服務供應商將開始為高性能、高容量的復雜分析提供功能完善的基于訂閱的商業智能或數據倉庫服務。這些“云服務”將充分利用微軟、Google和其他“軟件即服務”供應商所帶來的完全虛擬化、分布式、可擴展網格計算工具,用于數據挖掘、性能優化和其他計算密集型和數據密集型任務。
相信在不久的將來,利用DW2.0進行分析就像利用互聯網一樣普遍。不管是在生意場還是在我們的日常生活中,只要有需要,我們就可以用它來處理任何決策支持的任務,不管是大任務還是小任務。
【編輯推薦】