成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

這么火的數(shù)倉確定不學(xué)習(xí)一下?

運維 數(shù)據(jù)庫運維
Apache Doris是一個現(xiàn)代化的MPP(大規(guī)模并行處理)分析型數(shù)據(jù)庫產(chǎn)品。僅需亞秒級響應(yīng)時間即可獲得查詢結(jié)果,有效地支持實時數(shù)據(jù)分析。Apache Doris的分布式架構(gòu)非常簡潔,易于運維,并且可以支持10PB以上的超大數(shù)據(jù)集。

[[420263]]

一、 Doris 簡介

什么是Doris

Apache Doris是一個現(xiàn)代化的MPP(大規(guī)模并行處理)分析型數(shù)據(jù)庫產(chǎn)品。僅需亞秒級響應(yīng)時間即可獲得查詢結(jié)果,有效地支持實時數(shù)據(jù)分析。Apache Doris的分布式架構(gòu)非常簡潔,易于運維,并且可以支持10PB以上的超大數(shù)據(jù)集。Apache Doris可以滿足多種數(shù)據(jù)分析需求,例如固定歷史報表,實時數(shù)據(jù)分析,交互式數(shù)據(jù)分析和探索式數(shù)據(jù)分析等。

Doris 由百度大數(shù)據(jù)部研發(fā) ( 百度 Palo),在百度內(nèi)部,有超過200個產(chǎn)品線在使用,部署機器超過1000臺,單一業(yè)務(wù)最大可達到上百 TB。百度將 Doris 貢獻給 Apache 社區(qū)之后,許多外部用戶也成為了 Doris 的使用者,例如新浪微博,美團,小米等著名企業(yè)。

關(guān)鍵字:MPP,分布式,數(shù)據(jù)分析,PB級

優(yōu)點

兼容MySQL協(xié)議。

聚合表技術(shù)+預(yù)聚合技術(shù)。

動態(tài)水平拓展和自動負(fù)載均衡。

缺點

網(wǎng)絡(luò)上相關(guān)經(jīng)驗少。

二、 Doris定位

在數(shù)據(jù)分析處理框架中,Doris 主要做的是 Online 層面的數(shù)據(jù)服務(wù),主要處理的是數(shù)據(jù)分析方面的服務(wù)。

Doris適用場景有以下:

1、報表

報表類數(shù)據(jù)分析,數(shù)據(jù)分析以及查詢的模式相對比較固定,而且后臺 SQL 的模式往往都是確定的。針對此類應(yīng)用場景,選擇使用 MySQL 存結(jié)果數(shù)據(jù),用戶可從界面選擇執(zhí)行批處理以及發(fā)送郵件。在 Doris 平臺中,報表類查詢時延一般在秒級以下。

2、多維分析

這里提到的多維分析,同樣要求數(shù)據(jù)是結(jié)構(gòu)化的,適用于查詢相對靈活的場景,例如數(shù)據(jù)分析條件以及聚合維度等方面不是很確定,一般將此類數(shù)據(jù)分析定義為多維分析。相對于報表類分析,多維分析的查詢時延會稍慢,大約在會在 10s 的級別。

三、 Doris 架構(gòu)

Doris 架構(gòu)圖如下:

Doris 的整體架構(gòu)和 TiDB 類似,借助 MySQL 協(xié)議,用戶使用任意 MySQL 的 ODBC/JDBC以及MySQL 的客戶端,都可以直接訪問 Doris。Doris 中的模塊包括 FE 和 BE 兩類:FE 主要負(fù)責(zé)元數(shù)據(jù)的管理、存儲,以及查詢的解析等;一個用戶請求經(jīng)過 FE 解析、規(guī)劃后,具體的執(zhí)行計劃會發(fā)送給 BE,BE 則會完成查詢的具體執(zhí)行。BE 節(jié)點主要負(fù)責(zé)數(shù)據(jù)的存儲、以及查詢計劃的執(zhí)行。目前平臺的 FE 部分主要使用 Java,BE 部分主要使用 C++。

四、 Doris 數(shù)據(jù)結(jié)構(gòu)

如果從表的角度來看數(shù)據(jù)結(jié)構(gòu),用戶的一張 Table 會拆成多個 Tablet,Tablet 會存成多副本,存儲在不同的 BE 中,從而保證數(shù)據(jù)的高可用和高可靠。

五、 MPP(Massively Parallel Processing)

MPP 將SQL拆分成多份,分布到每臺機器執(zhí)行,最后再將結(jié)果匯總。假如有10臺機器,在大數(shù)據(jù)量下,這種查詢執(zhí)行方式可以使得查詢性能達到10倍的提升。

六、 表設(shè)計

列式存儲

Doris的表和關(guān)系型數(shù)據(jù)相同,由行和列構(gòu)成。每行數(shù)據(jù)對應(yīng)用戶一條記錄,每列數(shù)據(jù)有相同數(shù)據(jù)類型。所有數(shù)據(jù)的列數(shù)相同,可以動態(tài)增刪列。Doris中,張表的列可以分為維度列(也成為key列)和指標(biāo)列(value列),維度列用于分組和排序,指標(biāo)列可通過聚合函數(shù)SUM,COUNT,MIM,MAX,REPLACE,HLL_UNION,BITMAP_UNION等累加起來。因此,DorisDB的表也可以認(rèn)為是多維的key到多維指標(biāo)的映射。

稀疏索引

Doris對數(shù)據(jù)進行有序存儲,在數(shù)據(jù)有序的基礎(chǔ)上為其建立稀疏索引,索引粒度為block(1024行)。這其中有一個特殊的地方,就是 varchar 類型的字段。varchar 類型字段只能作為稀疏索引的最后一個字段。索引會在 varchar 處截斷,因此 varchar 如果出現(xiàn)在前面,可能索引的長度可能不足 36 個字節(jié)。具體可以參閱 數(shù)據(jù)模型、ROLLUP 及前綴索引。

除稀疏索引之外,Doris還提供bloomfilter索引,bloomfilter索引對區(qū)分度比較大的列過濾效果明顯。如果考慮到varchar不能放在稀疏索引中,可以建立bloomfilter索引。

七、 數(shù)據(jù)模型

明細(xì)模型

Doris建表的默認(rèn)模型是明細(xì)模型。

一般用明細(xì)模型來處理的場景有如下特點:

1. 需要保留原始的數(shù)據(jù)(例如原始日志,原始操作記錄等)來進行分析;

2. 查詢方式靈活,不局限于預(yù)先定義的分析式,傳統(tǒng)的預(yù)聚合方式難以命中;

3. 數(shù)據(jù)更新不頻繁。導(dǎo)入數(shù)據(jù)的來源一般為日志數(shù)據(jù)或者是時序數(shù)據(jù),以追加寫為主要特點,數(shù)據(jù)產(chǎn)生后就不會發(fā)生太多變化。

聚合模型

適合采用聚合模型來分析的場景具有如下特點:

1. 業(yè)務(wù)方進行的查詢?yōu)閰R總類查詢,比如sum、count、 max等類型的查詢;

2. 不需要召回原始的明細(xì)數(shù)據(jù);

3. 老數(shù)據(jù)不會被頻繁更新,只會追加新數(shù)據(jù)。

Doris會將指標(biāo)列按照相同維度列進行聚合。當(dāng)多條數(shù)據(jù)具有相同的維度時,Doris會把指標(biāo)進行聚合。從而能夠減少查詢時所需要的處理的數(shù)據(jù)量,進而提升查詢的效率。

更新模型

適合采用更新模型來分析的場景具有如下特點:

1. 已經(jīng)寫入的數(shù)據(jù)有存量的更新需求;

2. 需要進行實時數(shù)據(jù)分析。

更新模型中,排序鍵滿足唯一性約束,成為主鍵。

Doris存儲內(nèi)部會給每一個批次導(dǎo)入數(shù)據(jù)分配一個版本號,同一主鍵的數(shù)據(jù)可能有多個版本,查詢時,最大(最新)版本的數(shù)據(jù)勝出。

八、 物化視圖

物化視圖是提取某些維度的組合建立對用戶透明的卻有真實數(shù)據(jù)的視圖表格。Doris 的物化視圖可以保證用戶在更新時,直接更新原始表,Doris 會保證原表、物化視圖原子生效。在查詢的時候用戶也只需指定原始表,Doris 會根據(jù)查詢的具體條件,選擇適合的物化視圖完成查詢。

通常用戶可以通過物化視圖功能完成以下兩種功能。

1、更換索引列進行重排列。

2、針對指定列做聚合查詢。

 

責(zé)任編輯:武曉燕 來源: 碼蟲甲
相關(guān)推薦

2023-11-23 17:02:34

LinuxSED工具

2022-01-13 10:45:48

數(shù)倉對象主題域

2019-11-18 14:45:13

代碼開發(fā)工具

2023-02-08 09:02:05

VS Code摸魚神器

2019-11-12 13:39:35

電腦中央處理器軟件

2018-09-27 14:50:04

機器學(xué)習(xí)數(shù)據(jù)科學(xué)書籍

2013-03-04 10:10:36

WebKit瀏覽器

2018-03-15 15:51:40

戴爾

2021-06-24 07:54:20

vite 靜態(tài)處理public

2022-09-23 15:01:33

圖片加載代碼

2021-03-10 18:05:16

JavaProtobuf序列化

2021-01-26 05:39:57

Protobuf java

2024-03-07 10:21:56

2024-01-10 17:04:13

通信模塊通信技術(shù)通信模組

2014-08-26 11:03:54

2020-04-16 18:04:07

JavaScript前端技術(shù)

2023-11-23 16:53:56

數(shù)據(jù)倉庫大數(shù)據(jù)

2023-12-26 01:14:20

函數(shù)式編程死鎖

2021-06-15 10:19:11

機器學(xué)習(xí)人工智能計算機

2018-05-10 17:39:13

Python 機器學(xué)習(xí)編程語言
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 欧美日韩高清一区二区三区 | 男人的天堂一级片 | 成人国产a | 欧美一区2区三区3区公司 | 成人午夜看片 | 亚洲精品中文字幕中文字幕 | 日韩在线不卡 | 亚洲国产精品一区二区三区 | 欧美精品在线免费观看 | 亚洲一区中文字幕 | 中文字幕一区在线观看视频 | 97超碰人人 | 色网在线看 | 日韩成人影院 | 国产 欧美 日韩 一区 | 在线播放第一页 | 精品国产一区二区三区日日嗨 | 国产精品九九九 | 国产免费看| 激情三区| 亚洲第一中文字幕 | 中文字幕亚洲一区 | 亚洲电影在线播放 | 国产二区三区 | 福利精品在线观看 | 亚洲成人自拍 | 亚洲国产精品一区二区三区 | 91久久看片 | 网黄在线| 久久成人综合 | 免费能直接在线观看黄的视频 | 一级特黄a大片 | 国产二区精品视频 | 北条麻妃一区二区三区在线观看 | 黄色国产视频 | 日本欧美在线 | 九一在线观看 | 欧美三级不卡 | 国产永久免费 | 日韩二三区 | 国产一区二区三区在线 |