成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Apache Doris:基于MPP架構的實時分析數據庫,是時候上手了

開發 架構
Apache Doris 是一個基于 MPP 架構的高性能實時分析數據庫,以極速和易用性著稱。海量數據下僅需亞秒級響應時間即可返回查詢結果,不僅可以支持高并發點查詢場景,還可以支持高吞吐量的復雜分析場景。

Apache Doris 是一個基于 MPP 架構的高性能實時分析數據庫,以極速和易用性著稱。海量數據下僅需亞秒級響應時間即可返回查詢結果,不僅可以支持高并發點查詢場景,還可以支持高吞吐量的復雜分析場景。基于此,Apache Doris可以更好的滿足報表分析、即席查詢、統一數倉、數據湖查詢加速等場景,用戶可以構建用戶行為分析、AB測試平臺、日志檢索分析、用戶畫像分析、訂單分析,以及在此之上的其他應用程序。

Apache Doris最早誕生于百度廣告報表業務的Palo項目,2017年正式開源,2018年7月由百度捐贈給Apache基金會孵化,在Apache導師的指導下,由孵化器項目管理委員會成員進行孵化和運營。Apache Doris 順利畢業于 Apache 孵化器,并于 2022 年 6 月成為頂級項目。目前,Apache Doris 社區聚集了來自不同行業近百家公司的 300 多名貢獻者,活躍貢獻者人數接近 100 人/月。

Apache Doris 目前在中國乃至全球擁有廣泛的用戶群,截至今天,Apache Doris 已在全球超過 500 家公司的生產環境中使用。中國互聯網市值或估值前50強企業中,80%以上長期使用Apache Doris百度、美團、小米、京東、字節跳動、騰訊、網易、快手、微博等。它還廣泛應用于金融、能源、制造、電信等一些傳統行業。

使用場景

如下圖所示,經過各種數據整合和處理后,數據源通常存儲在實時數倉Doris和離線數據湖或數倉(Apache Hive、Apache Iceberg或Apache Hudi中)。

使用場景

Apache Doris 廣泛應用于以下場景:

報告分析

  • 實時儀表板
  • 生成內部分析師和經理的報告
  • 面向用戶或客戶的高并發報表分析:比如網站主 做站點分析,廣告主 做廣告報表等場景,并發通常需要上千QPS,查詢時延需要亞秒級響應。著名電商京東在廣告報表中使用Doris,每天寫入100億行數據,上萬并發查詢QPS,99%查詢延遲150ms。

即席查詢

面向分析師的具有不規則查詢模式和高吞吐量要求的的自助服務分析。小米基于Doris構建了增長分析平臺(Growth Analytics,GA),利用用戶行為數據進行業務增長分析,平均查詢延遲10秒,95%查詢延遲30秒以下,數萬每天的 SQL 查詢數。

統一數據倉庫建設

Doris 是一個滿足統一數據倉庫建設需求,簡化復雜數據軟件棧的平臺。海底撈基于Doris的統一數據倉庫取代了由Apache Spark、Apache Hive、Apache Kudu、Apache HBase、Apache Phoenix組成的舊架構,大大簡化了架構。

數據湖查詢

通過使用外部表聯合位于 Apache Hive、Apache Iceberg 和 Apache Hudi 中的數據,在避免數據復制的同時大大提高了查詢性能。

技術概覽

Apache Doris 的整體架構如下圖所示。Doris 架構非常簡單,只有兩類進程。

  • Frontend(FE):主要負責用戶請求接入、查詢解析和規劃、元數據管理、節點管理等相關工作。
  • 后端(BE):主要負責數據存儲和查詢計劃執行。

兩種類型的進程都可以水平擴展,單個集群最多可以支持數百臺機器和數十 PB 的存儲容量。并且這兩類流程通過一致性協議保證了服務的高可用性和數據的高可靠性。這種高度集成的架構設計大大降低了分布式系統的運維成本。

Apache Doris 的架構

Doris采用MySQL協議,高度兼容MySQL方言,支持標準SQL。用戶可以通過各種客戶端工具訪問Doris,支持與BI工具無縫對接。

在存儲引擎方面,Doris采用列式存儲對數據進行按列編碼壓縮和讀取,在實現極高壓縮率的同時減少大量掃描無關數據,從而更高效地利用IO和CPU資源.

Doris 還支持比較豐富的索引結構來減少數據掃描:

  • 支持排序復合鍵索引:最多可以指定三列組成復合排序鍵。有了這個索引,可以對數據進行有效的剪枝,更好的支持高并發的上報場景。
  • Z-order 索引:使用Z-order 索引,您可以高效地對架構中的任意字段組合運行范圍查詢。
  • MIN/MAX 索引:有效過濾數字類型的等價和范圍查詢
  • 布隆過濾器:對高基數列的等價過濾和修剪非常有效
  • 倒排索引:它可以快速搜索任何字段

在存儲模型方面,Doris 支持多種存儲模型,針對不同場景有針對性的優化:

  • 聚合鍵模型:通過預先聚合來合并具有相同鍵的值列,以顯著提高性能。
  • 唯一鍵模型:鍵是唯一的。具有相同鍵的數據將被覆蓋,以實現行級數據更新。
  • 重復鍵模型:詳細的數據模型,可以滿足事實表的詳細存儲。

Doris 還支持強一致性物化視圖,物化視圖的更新和選擇在系統內部自動完成,不需要用戶手動選擇,從而顯著降低了物化視圖的維護成本。

在查詢引擎方面,Doris采用了MPP模型,節點間和節點內并行執行,也支持多張大表的分布式shuffle join,可以更好的應對復雜的查詢。

Apache Doris 的查詢引擎

Doris查詢引擎是向量化的,所有內存結構都可以以列格式布局,從而實現顯著減少虛擬函數調用、提高緩存命中率和高效使用SIMD指令。寬表聚合場景中的性能比非向量化引擎高 5-10 倍。

向量化查詢執行器

Doris使用自適應查詢執行技術,可以根據運行時的統計動態調整執行計劃,例如運行時過濾器技術,在運行時生成過濾器推送到探測端,并自動將過濾器穿透到探測端,大大減少了探測端的數據量,提高了連接性能。Doris 的運行時過濾器支持 In/Min/Max/Bloom 過濾器。

查詢優化器

在優化器方面,Doris 使用了 CBO 和 RBO 的組合,RBO 支持常量折疊、子查詢重寫、謂詞下推等,CBO支持 Join 重新排序。CBO仍在持續優化中,主要集中在更準確的統計信息收集和推導、更準確的成本模型預測等方面。

未來,Apache Doris除了數據分析之外,還將提升數據工程能力,更好地覆蓋企業數據ETL/ELT場景,通過一個平臺滿足多種混合工作負載。另一方面,對云基礎設施做深度優化,利用云提供的彈性和新硬件,提供性價比更好的產品。

為什么選擇 Apache Doris?

  • 易于使用:兩個進程,沒有其他依賴;在線集群伸縮,自動副本恢復;兼容MySQL協議,使用標準SQL。
  • 高性能:通過列式存儲引擎、現代 MPP 架構、矢量化查詢引擎、預聚合物化視圖和數據索引,為低延遲和高吞吐量查詢提供極快的性能。
  • 單一統一:單一系統可以支持實時數據服務、交互式數據分析和離線數據處理場景。
  • 聯邦查詢:支持Hive、Iceberg、Hudi等數據湖和MySQL、Elasticsearch等數據庫的聯邦查詢。
  • 多種數據導入方式:支持從HDFS/S3批量導入,從MySQL Binlog/Kafka流式導入;支持通過HTTP接口進行微批量寫入,也支持在JDBC中使用Insert實時寫入。
  • 豐富生態: Spark使用Spark-Doris-Connector讀寫Doris;Flink-Doris-Connector 使 Flink CDC 能夠實現 Exactly-once 數據寫入 Doris;提供 DBT Doris Adapter 用于將 Doris 中的數據與 DBT 進行轉換。
責任編輯:華軒 來源: 今日頭條
相關推薦

2024-01-09 16:02:11

數據庫流服務大數據

2016-11-29 09:27:22

Apache SparDashboard構建

2017-07-13 10:04:20

云客服分析架構

2020-04-25 21:04:09

NoSQL數據庫大數據

2023-10-26 16:06:50

BuildpackDocker

2023-06-01 21:50:53

Doris數倉SQL

2024-02-19 00:06:06

數據分析系統Doris

2016-08-31 14:41:31

大數據實時分析算法分類

2014-03-28 17:30:03

大數據應用

2016-11-22 13:25:28

Apache Spar大數據

2023-07-31 07:49:03

2022-07-18 16:02:10

數據庫實踐

2019-08-19 14:24:39

數據分析Spark操作

2011-07-12 09:20:08

XML數據庫

2023-12-28 10:58:45

2020-05-15 10:28:04

實時分析客戶需求CIO

2019-07-05 11:01:59

Google電子商務搜索引擎

2011-07-12 10:09:08

XML數據庫服務器

2016-10-31 19:19:20

實時分析

2023-05-08 07:20:22

Doris分析型數據庫
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲 欧美 另类 日韩 | 在线色网 | 欧美一级片在线 | 中文字幕人成乱码在线观看 | 亚洲精品不卡 | 激情免费视频 | 亚洲精品久久久久国产 | 99视频免费播放 | 天天天操天天天干 | 久草精品视频 | 91精品久久久久久久久中文字幕 | 日韩av免费在线电影 | 91精品国产91久久久久游泳池 | 亚洲三级av| 国产一区三区在线 | 在线婷婷 | a级毛片国产 | 午夜电影一区二区 | 涩涩视频在线观看 | 97高清国语自产拍 | 久久青视频| 91精品国产乱码久久久久久 | 超碰av免费 | 91社区在线观看 | 亚洲欧美另类在线观看 | 欧美日本高清 | 操视频网站| 日韩免费中文字幕 | 欧美一级一区 | www.天堂av.com | 91精品国产欧美一区二区 | 二区在线视频 | 国产成人精品免费 | 成人亚洲| 精品欧美乱码久久久久久 | 日韩1区2区 | 婷婷综合久久 | 久热爱 | 久久91精品 | 亚洲免费观看视频 | 成人黄色av网站 |