簡(jiǎn)述數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)集市,數(shù)據(jù)湖泊、和運(yùn)營(yíng)數(shù)據(jù)存儲(chǔ)
數(shù)據(jù)倉(cāng)庫(kù)
互聯(lián)網(wǎng)和大規(guī)模技術(shù)開(kāi)發(fā)使得當(dāng)今世界中數(shù)據(jù)的爆炸性增長(zhǎng)。企業(yè)決策者希望研究數(shù)據(jù)之間的關(guān)系,點(diǎn)擊數(shù)據(jù)的隱藏功能并分析和探索更深層次的數(shù)據(jù)。
但在企業(yè)的不同數(shù)據(jù)庫(kù)之間,數(shù)據(jù)共享是不可能的,由于同一企業(yè)中的多個(gè)數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)之間的集成具有大量挑戰(zhàn),特別是在巨大數(shù)據(jù)的合并和存儲(chǔ)方面
操作數(shù)據(jù)庫(kù)可以分散在Microsoft SQL Server數(shù)據(jù)庫(kù)或Oracle數(shù)據(jù)庫(kù)周?chē)瑪?shù)據(jù)倉(cāng)庫(kù)目標(biāo)是提取多個(gè)數(shù)據(jù)庫(kù)并累積從數(shù)百個(gè)千兆字節(jié)的數(shù)據(jù)進(jìn)行處理,以便根據(jù)所需格式,進(jìn)程進(jìn)入必要的轉(zhuǎn)換,清潔,清潔,最后將數(shù)據(jù)加載到倉(cāng)庫(kù)中。
根據(jù)IBM研究人員(Barry devlin和Paul Murphy)“數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)主題導(dǎo)向的,集成,相對(duì)穩(wěn)定的數(shù)據(jù)收集,反映了歷史變化,用于支持管理決策”
- By Nature,數(shù)據(jù)倉(cāng)庫(kù)用于補(bǔ)充管理的決策,它被用作業(yè)務(wù)數(shù)據(jù)操作的分析,但它與企業(yè)的運(yùn)營(yíng)數(shù)據(jù)庫(kù)不同。
- 數(shù)據(jù)倉(cāng)庫(kù)是將多個(gè)異構(gòu)數(shù)據(jù)源的有效集成和管理到一個(gè)存儲(chǔ)庫(kù)中,它是在歷史數(shù)據(jù)方面組織的,并且在數(shù)據(jù)倉(cāng)庫(kù)中,不需要對(duì)數(shù)據(jù)的交易修改。
在數(shù)據(jù)倉(cāng)庫(kù)出現(xiàn)后,企業(yè)的信息需求已經(jīng)遠(yuǎn)離關(guān)系數(shù)據(jù)庫(kù)到?jīng)Q策支持系統(tǒng)。該決策支持系統(tǒng)實(shí)際上是我們稱(chēng)為商業(yè)智能(BI)。
數(shù)據(jù)庫(kù)
與數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)集合的比較可以被理解為“小數(shù)據(jù)倉(cāng)庫(kù)”,它不是根據(jù)異構(gòu)數(shù)據(jù)庫(kù),而是僅在單個(gè)操作數(shù)據(jù)庫(kù)實(shí)例上,數(shù)據(jù)范圍不夠?qū)挕?/p>
數(shù)據(jù)集市專(zhuān)門(mén)針對(duì)數(shù)據(jù)集市的特定業(yè)務(wù)運(yùn)營(yíng)(銷(xiāo)售,生產(chǎn))用戶(hù)快速找到所需的數(shù)據(jù),在數(shù)據(jù)集市中,您只需要設(shè)計(jì)和構(gòu)建數(shù)據(jù)庫(kù)表,填充數(shù)據(jù)庫(kù)表與相關(guān)數(shù)據(jù),決定誰(shuí)可以訪問(wèn)數(shù)據(jù)集。
數(shù)據(jù)集市可分為兩種類(lèi)型:
- 第一個(gè)是獨(dú)立數(shù)據(jù)集市,ETL架構(gòu)和數(shù)據(jù)庫(kù)的來(lái)源屬于一個(gè)實(shí)體。
- 第二個(gè)是依賴(lài)數(shù)據(jù)集市,在這種類(lèi)型的數(shù)據(jù)集市中,進(jìn)入數(shù)據(jù)主要來(lái)自其他來(lái)源,主要來(lái)自數(shù)據(jù)倉(cāng)庫(kù)。Datamart可以簡(jiǎn)單地為用戶(hù)提供數(shù)據(jù)倉(cāng)庫(kù)的信息子集。
數(shù)據(jù)湖
它與自然狀態(tài)的流動(dòng)水有多像流動(dòng)的水,數(shù)據(jù)流從多個(gè)源系統(tǒng)到這個(gè)湖,用戶(hù)可以獲得他們想要的特定數(shù)據(jù),驗(yàn)證,彌補(bǔ)和其他雙務(wù)任務(wù)將在數(shù)據(jù)湖外執(zhí)行。
數(shù)據(jù)湖可以以以下功能實(shí)現(xiàn)的方式開(kāi)發(fā):
- 它將導(dǎo)入來(lái)自源系統(tǒng)的所有數(shù)據(jù),源系統(tǒng)沒(méi)有數(shù)據(jù)丟失。
- 數(shù)據(jù)存儲(chǔ)在其原始狀態(tài)下,而不會(huì)轉(zhuǎn)換原始數(shù)據(jù)。
- Data Lake Schema準(zhǔn)確符合數(shù)據(jù)分析要求。
- 數(shù)據(jù)湖有鎖,控制和治理
操作數(shù)據(jù)存儲(chǔ)
操作數(shù)據(jù)存儲(chǔ)(ODS)是用于交易處理數(shù)據(jù)的數(shù)據(jù)庫(kù),ODS中的數(shù)據(jù)主要是原始數(shù)據(jù),來(lái)自O(shè)DS的數(shù)據(jù)總是向數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市移出以進(jìn)行進(jìn)一步處理。在ODS中,您可以查詢(xún)數(shù)據(jù),只能訪問(wèn)業(yè)務(wù)運(yùn)營(yíng)中的最新開(kāi)發(fā)
原文鏈接:
https://medium.com/dataprophet/data-warehouse-data-mart-data-lake-and-operational-data-storage-3a69f8701466