多維數(shù)據(jù)集在SQLServer 2000 中存儲數(shù)據(jù)實際應用
此文章主要向大家介紹的是多維數(shù)據(jù)集在SQLServer 2000 中存儲數(shù)據(jù)的實際應用,以及對實現(xiàn) Microsoft SQL Server 2000的實際操作方法,我們大家都知道數(shù)據(jù)倉庫中數(shù)據(jù)存儲的結構與傳統(tǒng)的在線事務處理系統(tǒng)(OLTP)完全不同。
其原因在于,OLTP 系統(tǒng)擁有許多用戶,通常在給定會話中處理不同的數(shù)據(jù)對象;而在線分析處理系統(tǒng)(OLAP)用戶較少,但通常引入大量的數(shù)據(jù)。因此,從設計角度來看,創(chuàng)建一種能讓相關數(shù)據(jù)存入物理上相近空間的結構是非常重要的,以至于能用最少的讀取次數(shù)將其取出。
此類存儲的理想結構應當是星型模式,用多維數(shù)據(jù)集實現(xiàn)。在這樣的結構中,表格并非用關系數(shù)據(jù)庫系統(tǒng)(RDBMS)中的關系模式關聯(lián),而是通過一個中央鍵表,以定義了數(shù)據(jù)從邏輯相關的表中搜集的維數(shù)。
為了達到此目的,數(shù)據(jù)必須被非常規(guī)化。在這種組織方法中,中央表會產(chǎn)生冗余。經(jīng)驗規(guī)律表明,在配置 OLTP 數(shù)據(jù)庫中需要做的一切,正好與應在 OLAP 數(shù)據(jù)庫中需要做的相反。以下講述的是其在 Microsoft SQL Server 2000 中的實現(xiàn)方法。
裝載 搜索 MOLAP 數(shù)據(jù)
MOLAP 的意思是多維 (Multidimemsional) OLAP。這不過是多維分析數(shù)據(jù)庫 (analytical cube database) 的另一種說法。SQL Server 2000 有一套名為 Analysis Services 的工具,實現(xiàn)了多維分析數(shù)據(jù)庫的構建,同時提供了管理工具與用戶訪問軟件。這套工具原先是為 SQL Server 7.0 的 OLAP 服務開發(fā)的,對 OLAP 和數(shù)據(jù)挖掘同樣適用。
第一步應當是訪問 Analysis Manager ,在開始 | 程序 | Microsoft SQL Server | Analysis Service 中。你會看到程序的左欄顯示了所有有效的資源,右欄顯示詳細信息(在安裝 Analysis Service 時會創(chuàng)立初始 ODBC 數(shù)據(jù)源名稱 (DSN))??梢栽诳刂泼姘?| 管理工具 | 數(shù)據(jù)源中對其進行管理。在系統(tǒng) DNS 選項卡中列出了有效的數(shù)據(jù)庫。在此屏幕中可以添加或者刪除數(shù)據(jù)源。
數(shù)據(jù)源,為常規(guī)事務處理系統(tǒng)(通常為收集的數(shù)據(jù),或在線歷史表)中的數(shù)據(jù)表,儲存著即將遷移指數(shù)據(jù)倉庫的信息。你將利用這些數(shù)據(jù)源為數(shù)據(jù)倉庫提供初始數(shù)據(jù),如需要也會定期使用它們將數(shù)據(jù)添加至數(shù)據(jù)倉庫。
當添加或移除適當?shù)臄?shù)據(jù)源之后,你已經(jīng)為在 Analysis Manager 中創(chuàng)建 OLAP 數(shù)據(jù)庫做好了準備。回到列示分析數(shù)據(jù)庫服務器名字的左邊窗格。在其中點擊鼠標右鍵,選擇 New Database,添加名字與描述。當然,目前數(shù)據(jù)庫是空的,還沒有數(shù)據(jù)結構。
現(xiàn)在你可以為數(shù)據(jù)庫添加數(shù)據(jù),如上述的多維形式的數(shù)據(jù)表:在左窗格剛建立的數(shù)據(jù)庫下方的 Cube 上點擊右鍵,選擇 New Cube,就會出現(xiàn)一個向導和一個編輯器。選擇向導并按照它的提示進行。你會被指引選擇數(shù)據(jù)源,包括設置 Data Link 屬性 (提供了一系列 Microsoft 的選項),以及建立一個到數(shù)據(jù)庫服務器的連接。
現(xiàn)在,向導將會讓你定義一個“事實”表,或者叫做上下文關聯(lián)序列,指定多維集的深度和方向。確定了這些,就做好了定義多維集維度的準備了。
此向導現(xiàn)在將協(xié)助你定義實際表的列數(shù),多維集的維數(shù) (通過 New Dimension 按鈕打開嵌套的維度向導),以及模式選擇。
維度向導將使用你所指定的數(shù)據(jù)表(以及嵌套字段)協(xié)助你繼續(xù)多維數(shù)據(jù)集的構建。然后,你可以指定關鍵列。 最后,維度向導會給你一個存儲模式的選擇。請選擇 Store as multidimensional OLAP (MOLAP)。當你完成此向導后,將會回到數(shù)據(jù)集向導并結束其構建過程。
在 Storage Design Wizard (存儲設計向導)——允許你優(yōu)化數(shù)據(jù)存儲以提高性能的向導中也可以使用它。其后,在 Analysis Manager 的左窗格樹形目錄中選擇 Cube Roles 項,為多維集創(chuàng)建安全特性。
重述
用 SQL Server 2000 實現(xiàn) OLAP 的有利性在于,當創(chuàng)建多維數(shù)據(jù)集時同時創(chuàng)建了一個與數(shù)據(jù)集匹配的可持續(xù)訪問的對象。因此你可以通過 Analysis Manager 的 Browse Data 選項瀏覽多維集,或者查詢數(shù)據(jù)庫獲得大批量的數(shù)據(jù)。然后,就可以通過對維度的拖放操作建立需要分析的任何數(shù)據(jù)體。
這是高效率的代表:用優(yōu)化過的結構存儲與獲取數(shù)據(jù),而該結構創(chuàng)建了對分析過程最有用數(shù)據(jù)的視圖。表格的無規(guī)律相關降到了最小,數(shù)據(jù)在物理空間中順序存儲,讀取次數(shù)也最少化了。這對 IT 顧問與他們的客戶來說,都是有用而高效的選擇。
其他平臺
如果在使用一個基于 ERP 系統(tǒng)建立的數(shù)據(jù)倉庫,如 SAP R/3 或 Oracle,你會發(fā)現(xiàn),在構建工具方面會有所不同,但基本概念與結構都是一樣的。仔細斟酌這些系統(tǒng)在您環(huán)境中的表現(xiàn),將會使您的規(guī)劃更加高效、靈活。
【編輯推薦】