數據庫設計過程
一、數據庫設計過程
數據庫技術是信息資源管理最有效的手段。數據庫設計是指對于一個給定的應用環境,構造***的數據庫模式,建立數據庫及其應用系統,有效存儲數據,滿足用戶信息要求和處理要求。
數據庫設計中需求分析階段綜合各個用戶的應用需求(現實世界的需求),在概念設計階段形成獨立于機器特點、獨立于各個dbms產品的概念模式(信息世界模型),用e-r圖來描述。在邏輯設計階段將e-r圖轉換成具體的數據庫產品支持的數據模型如關系模型,形成數據庫邏輯模式。然后根據用戶處理的要求,安全性的考慮,在基本表的基礎上再建立必要的視圖(view)形成數據的外模式。在物理設計階段根據dbms特點和處理的需要,進行物理存儲安排,設計索引,形成數據庫內模式。
1. 需求分析階段
需求收集和分析,結果得到數據字典描述的數據需求(和數據流圖描述的處理需求)。
需求分析的重點是調查、收集與分析用戶在數據管理中的信息要求、處理要求、安全性與完整性要求。
需求分析的方法:調查組織機構情況、調查各部門的業務活動情況、協助用戶明確對新系統的各種要求、確定新系統的邊界。
常用的調查方法有: 跟班作業、開調查會、請專人介紹、詢問、設計調查表請用戶填寫、查閱記錄。
分析和表達用戶需求的方法主要包括自頂向下和自底向上兩類方法。自頂向下的結構化分析方法(structured analysis,簡稱sa方法)從最上層的系統組織機構入手,采用逐層分解的方式分析系統,并把每一層用數據流圖和數據字典描述。
數據流圖表達了數據和處理過程的關系。系統中的數據則借助數據字典(data dictionary,簡稱dd)來描述。
數據字典是各類數據描述的集合,它是關于數據庫中數據的描述,即元數據,而不是數據本身。數據字典通常包括數據項、數據結構、數據流、數據存儲和處理過程五個部分(至少應該包含每個字段的數據類型和在每個表內的主外鍵)。
數據項描述={數據項名,數據項含義說明,別名,數據類型,長度,
取值范圍,取值含義,與其他數據項的邏輯關系}
數據結構描述={數據結構名,含義說明,組成:{數據項或數據結構}}
數據流描述={數據流名,說明,數據流來源,數據流去向,
組成:{數據結構},平均流量,高峰期流量}
數據存儲描述={數據存儲名,說明,編號,流入的數據流,流出的數據流,
組成:{數據結構},數據量,存取方式}
處理過程描述={處理過程名,說明,輸入:{數據流},輸出:{數據流},
處理:{簡要說明}}
2. 概念結構設計階段
通過對用戶需求進行綜合、歸納與抽象,形成一個獨立于具體dbms的概念模型,可以用e-r圖表示。
概念模型用于信息世界的建模。概念模型不依賴于某一個dbms支持的數據模型。概念模型可以轉換為計算機上某一dbms支持的特定數據模型。
概念模型特點:
(1) 具有較強的語義表達能力,能夠方便、直接地表達應用中的各種語義知識。
(2) 應該簡單、清晰、易于用戶理解,是用戶與數據庫設計人員之間進行交流的語言。
概念模型設計的一種常用方法為idef1x方法,它就是把實體-聯系方法應用到語義數據模型中的一種語義模型化技術,用于建立系統信息模型。
使用idef1x方法創建e-r模型的步驟如下所示:
2.1 第零步——初始化工程
這個階段的任務是從目的描述和范圍描述開始,確定建模目標,開發建模計劃,組織建模隊伍,收集源材料,制定約束和規范。收集源材料是這階段的重點。通過調查和觀察結果,業務流程,原有系統的輸入輸出,各種報表,收集原始數據,形成了基本數據資料表。
2.2 ***步——定義實體
實體集成員都有一個共同的特征和屬性集,可以從收集的源材料——基本數據資料表中直接或間接標識出大部分實體。根據源材料名字表中表示物的術語以及具有 “代碼”結尾的術語,如客戶代碼、代理商代碼、產品代碼等將其名詞部分代表的實體標識出來,從而初步找出潛在的實體,形成初步實體表。
2.3 第二步——定義聯系
idef1x模型中只允許二元聯系,n元聯系必須定義為n個二元聯系。根據實際的業務需求和規則,使用實體聯系矩陣來標識實體間的二元關系,然后根據實際情況確定出連接關系的勢、關系名和說明,確定關系類型,是標識關系、非標識關系(強制的或可選的)還是非確定關系、分類關系。如果子實體的每個實例都需要通過和父實體的關系來標識,則為標識關系,否則為非標識關系。非標識關系中,如果每個子實體的實例都與而且只與一個父實體關聯,則為強制的,否則為非強制的。如果父實體與子實體代表的是同一現實對象,那么它們為分類關系。
2.4 第三步——定義碼
通過引入交叉實體除去上一階段產生的非確定關系,然后從非交叉實體和獨立實體開始標識侯選碼屬性,以便唯一識別每個實體的實例,再從侯選碼中確定主碼。為了確定主碼和關系的有效性,通過非空規則和非多值規則來保證,即一個實體實例的一個屬性不能是空值,也不能在同一個時刻有一個以上的值。找出誤認的確定關系,將實體進一步分解,***構造出idef1x模型的鍵基視圖(kb圖)。
2.5 第四步——定義屬性
從源數據表中抽取說明性的名詞開發出屬性表,確定屬性的所有者。定義非主碼屬性,檢查屬性的非空及非多值規則。此外,還要檢查完全依賴函數規則和非傳遞依賴規則,保證一個非主碼屬性必須依賴于主碼、整個主碼、僅僅是主碼。以此得到了至少符合關系理論第三范式的改進的idef1x模型的全屬性視圖。
2.6 第五步——定義其他對象和規則
定義屬性的數據類型、長度、精度、非空、缺省值、約束規則等。定義觸發器、存儲過程、視圖、角色、同義詞、序列等對象信息。
3. 邏輯結構設計階段
將概念結構轉換為某個dbms所支持的數據模型(例如關系模型),并對其進行優化。設計邏輯結構應該選擇最適于描述與表達相應概念結構的數據模型,然后選擇最合適的dbms。
將e-r圖轉換為關系模型實際上就是要將實體、實體的屬性和實體之間的聯系轉化為關系模式,這種轉換一般遵循如下原則:
1)一個實體型轉換為一個關系模式。實體的屬性就是關系的屬性。實體的碼就是關系的碼。
2)一個m:n聯系轉換為一個關系模式。與該聯系相連的各實體的碼以及聯系本身的屬性均轉換為關系的屬性。而關系的碼為各實體碼的組合。
3)一個1:n聯系可以轉換為一個獨立的關系模式,也可以與n端對應的關系模式合并。如果轉換為一個獨立的關系模式,則與該聯系相連的各實體的碼以及聯系本身的屬性均轉換為關系的屬性,而關系的碼為n端實體的碼。
4)一個1:1聯系可以轉換為一個獨立的關系模式,也可以與任意一端對應的關系模式合并。
5)三個或三個以上實體間的一個多元聯系轉換為一個關系模式。與該多元聯系相連的各實體的碼以及聯系本身的屬性均轉換為關系的屬性。而關系的碼為各實體碼的組合。
6)同一實體集的實體間的聯系,即自聯系,也可按上述1:1、1:n和m:n三種情況分別處理。
7)具有相同碼的關系模式可合并。
為了進一步提高數據庫應用系統的性能,通常以規范化理論為指導,還應該適當地修改、調整數據模型的結構,這就是數據模型的優化。確定數據依賴。消除冗余的聯系。確定各關系模式分別屬于第幾范式。確定是否要對它們進行合并或分解。一般來說將關系分解為3nf的標準,即:
表內的每一個值都只能被表達一次。
•?表內的每一行都應該被唯一的標識(有唯一鍵)。
表內不應該存儲依賴于其他鍵的非鍵信息。
4. 數據庫物理設計階段
為邏輯數據模型選取一個最適合應用環境的物理結構(包括存儲結構和存取方法)。根據dbms特點和處理的需要,進行物理存儲安排,設計索引,形成數據庫內模式。
5. 數據庫實施階段
運用dbms提供的數據語言(例如sql)及其宿主語言(例如c),根據邏輯設計和物理設計的結果建立數據庫,編制與調試應用程序,組織數據入庫,并進行試運行。 數據庫實施主要包括以下工作:用ddl定義數據庫結構、組織數據入庫 、編制與調試應用程序、數據庫試運行
6. 數據庫運行和維護階段
數據庫應用系統經過試運行后即可投入正式運行。在數據庫系統運行過程中必須不斷地對其進行評價、調整與修改。包括:數據庫的轉儲和恢復、數據庫的安全性、完整性控制、數據庫性能的監督、分析和改進、數據庫的重組織和重構造。
建模工具的使用
為加快數據庫設計速度,目前有很多數據庫輔助工具(case工具),如rational公司的rational rose,ca公司的erwin和bpwin,sybase公司的powerdesigner以及oracle公司的oracle designer等。
erwin主要用來建立數據庫的概念模型和物理模型。它能用圖形化的方式,描述出實體、聯系及實體的屬性。erwin支持idef1x方法。通過使用 erwin建模工具自動生成、更改和分析idef1x模型,不僅能得到優秀的業務功能和數據需求模型,而且可以實現從idef1x模型到數據庫物理設計的轉變。erwin工具繪制的模型對應于邏輯模型和物理模型兩種。在邏輯模型中,idef1x工具箱可以方便地用圖形化的方式構建和繪制實體聯系及實體的屬性。在物理模型中,erwin可以定義對應的表、列,并可針對各種數據庫管理系統自動轉換為適當的類型。
設計人員可根據需要選用相應的數據庫設計建模工具。例如需求分析完成之后,設計人員可以使用erwin畫er圖,將er圖轉換為關系數據模型,生成數據庫結構;畫數據流圖,生成應用程序。
以上就是我要為大家介紹的數據庫設計的全部內容,希望大家從中可以學到東西,然后有利于以后的工作學習。
【編輯推薦】