成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

實時數倉|架構設計與技術選型

大數據
當我們做一個項目時往往都需要選擇該用什么技術。這一部分不是我們普通員工想的,而是架構師會根據客戶的需求選擇出合適的技術。

 [[376475]]

前言

當我們做一個項目時往往都需要選擇該用什么技術。這一部分不是我們普通員工想的,而是架構師會根據客戶的需求選擇出合適的技術。當選擇合適的技術會讓我們的開發事半功倍。下面我就來講解下我做的項目(實時數倉)是如何進行選型的。

一、技術選型

當我們在選擇技術時需要根據客戶的需求來進行選擇。比如:實時統計交易金額(要求延遲不能超過一秒),這時我們在選擇技術時就不能用那些批處理的技術比如Hive,MapRducer 等,因為MapRducer 啟動有可能就能超過了一秒鐘,所以根本就不能滿足這些需求。這時我們可以考慮用一些實時計算的技術如 Flink,SparkStreaming等。接下來我們就來講解下如何選擇。

 

目前市場是有很多實時計算的技術如:Spark streaming、Struct streaming、Storm 、JStorm(阿里) 、Kafka Streaming 、Flink 等眾多的技術棧我們該如何選擇那?

當我們在選擇技術時需要全面考慮,并不是你喜歡這個技術就要用這個技術,這不是明智的選擇。企業一般根據 公司員工的技術基礎、流行 、技術復用、場景等眾多的因素來進行選擇。附上一張技術圖

根據上述圖片就可以清晰的分析出該用什么技術。我在這里也推薦一下僅供參考

 

如果對延遲要求不高的情況下,可以使用 Spark Streaming,它擁有豐富的高級 API,使用簡單,并且 Spark 生態也比較成熟,吞吐量大,部署簡單,社區活躍度較高,從 GitHub 的 star 數量也可以看得出來現在公司用 Spark 還是居多的,并且在新版本還引入了 Structured Streaming,這也會讓 Spark 的體系更加完善。

如果對延遲性要求非常高的話,可以使用當下最火的流處理框架 Flink,采用原生的流處理系統,保證了低延遲性,在 API 和容錯性方面做的也比較完善,使用和部署相對來說也是比較簡單的,加上國內阿里貢獻的 Blink,相信接下來 Flink 的功能將會更加完善,發展也會更加好,社區問題的響應速度也是非常快的,另外還有專門的釘釘大群和中文列表供大家提問,每周還會有專家進行直播講解和答疑。

本項目:使用Flink來搭建實時計算平臺

二、需求分析

目前需求有最后通過報表實時展示:

統計用戶日活對比分析(PV、UV、游客數)分別使用柱狀圖顯示

 

2. 漏斗展示(付款數、下單數、加入購物車數、瀏覽數)

 

3. 統計一周銷售額,使用曲線圖顯示

4. 24小時銷售曲線圖顯示

 

5. 訂單狀態占比

6. 訂單完成狀態分析

 

7. TopN地區排行

 

數據來源PV/UV數據來源

  • 來自于頁面埋點數據,將用戶訪問數據發送到web服務器
  • web服務器直接將該部分數據寫入到kafka的click_log topic 中

銷售金額與訂單量數據來源

  • 訂單數據來源于mysql
  • 訂單數據來自binlog日志,通過canal 實時將數據寫入到kafka的order的topic中

購物車數據和評論數據

  • 購物車數據一般不會直接操作mysql,通過客戶端程序寫入到kafka(消息隊列)中
  • 評論數據也是通過客戶端程序寫入kafka(消息隊列)中

三、架構設計

根據分析需求我們可以這樣設計我們架構。

在線架構圖:https://gitmind.cn/app/flowchart/43aa8334090bdd1e1074271f08328e25

 

小結

本篇文章主要講解了如何選擇一合適技術棧,以及后面分享的技術實時數倉的架構圖。我們在離線數倉使用的是hive我們可以在Hive中進行一個層,而要做實時數倉的話需要使用消息隊列來做分層,本次項目使用Kafka來分層。我在這里為大家提供大數據的資源需要的朋友可以去下面GitHub去下載,信自己,努力和汗水總會能得到回報的。我是大數據老哥,我們下期見~~~

本文轉載自微信公眾號「大數據老哥」,可以通過以下二維碼關注。轉載本文請聯系大數據老哥公眾號。

 

責任編輯:武曉燕 來源: 大數據老哥
相關推薦

2023-05-06 07:19:48

數倉架構技術架構

2022-09-28 07:08:25

技術實時數倉

2021-12-10 12:08:25

高可用數倉Hologres

2023-10-13 07:25:50

2023-08-29 10:20:00

2022-08-01 15:58:48

數據倉庫架構數據

2023-07-06 00:41:03

SQLNoSQL數據庫

2022-07-07 10:19:05

數據畫像

2021-07-13 07:04:19

Flink數倉數據

2021-04-27 10:22:04

數倉分布式事務

2022-02-09 12:44:38

數倉Hologres運維

2021-07-22 18:29:58

AI

2022-04-24 14:40:05

架構大數據

2024-09-03 14:59:00

2020-12-01 15:06:46

KafkaFlink數據倉庫

2023-07-09 15:20:00

緩存平衡性能

2023-07-05 00:36:38

系統架構設計

2023-07-27 07:44:07

云音樂數倉平臺

2025-05-20 10:03:59

數據倉庫Flink SQLPaimon
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文字幕一区二区三区四区不卡 | 午夜视频在线 | 欧美中文字幕在线 | 国产精品18hdxxxⅹ在线 | 中文字幕三区 | 青青草一区二区 | 亚洲一区二区三区视频 | 成人一区二区在线 | 亚洲第一区久久 | 亚洲精品乱码久久久久久蜜桃91 | 亚洲视频欧美视频 | 中文字幕1区2区3区 亚洲国产成人精品女人久久久 | 国产免国产免费 | 国产亚洲黄色片 | 人人叉 | 国产成人精品久久二区二区91 | 午夜私人影院在线观看 | 蜜桃精品视频在线 | 久久中文字幕一区 | 欧美日韩一区二区在线播放 | 亚洲国产成人av好男人在线观看 | 男人av网| 欧美精品在线一区 | 中文字幕日韩在线观看 | 狠狠爱视频 | 亚洲精品视频免费观看 | 日韩成人av在线播放 | 麻豆av在线免费观看 | 久久精品国产亚洲 | 欧美区日韩区 | 做a视频 | 成人1区2区 | 国产精品视频97 | 久久久精品一区 | www国产成人免费观看视频,深夜成人网 | 精品久久国产老人久久综合 | 97热在线| 久久精品欧美一区二区三区不卡 | 久久婷婷色 | 欧美成视频 | 青青草一区 |