成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

基于 Flink x TiDB,智慧芽打造實時分析新方案

數據庫
本文整理自智慧芽數據倉庫架構師曲明星在 Flink Forward Asia 2021 實時數倉專場的分享。

?摘要:本文整理自智慧芽數據倉庫架構師曲明星在 Flink Forward Asia 2021 實時數倉專場的分享。本篇內容主要分為三個部分:

  1. 產品架構
  2. 技術架構
  3. 未來計劃

01產品架構

圖片

上圖是智慧芽APP 的產品架構圖,包括后臺管理系統、AI、內容引擎、幫助中心,為客戶提供知識產權信息化服務和科技創新情報系統。

02技術架構

2.1 原實時分析方案

圖片

上圖是原來的實時分析方案。流程大致是客戶檢索一個條件,通過分析 API 把客戶檢索的相關條件發送到不同的搜索引擎。這種方案會產生 4 個問題:

  • 對檢索性能產生影響;
  • 復雜分析需要開發插件支持;
  • 跨多個搜索引擎分析復雜度高;
  • 不同維度的數據無法存儲。

在建立實時數倉前,收集了業務要求實時數倉特點:

  • 秒級響應;
  • 準實時數據更新;
  • 能支持一定量的并發能力;
  • 與搜索引擎數據保持一致;
  • 支持復雜分析的能力;
  • 支持統一使用方式及主流特性;
  • 支持與搜索引擎交互;
  • 支持存儲容量橫向擴展的能力。

圖片

上圖是數據平臺概覽。從下往上看:

  • 最下層是數據底座,包括數據存儲和數據計算,其中數據計算層由 Spark、Kafka、Flink 組成;
  • 中間層是數據平臺,包括數據開發、數據分類、數據管理和數據服務;
  • 上層是數據應用,主要有數據業務、外部分析服務和內部分析業務構成。

2.2 新實時分析方案

圖片

新的技術選型主要基于 TiDB,主要包括數據存儲、數倉服務兩個部分。數倉服務分為安全檢查、驅動表管理、緩存管理、集群負載檢查以及執行器等部分。

選擇 TiDB 是因為它是云原生并且社區活躍、滿足 TP 及 AP 業務場景、豐富的生態工具及多平臺以及其使用簡單,兼容 MySQL 以及大數據能力。

選擇 Flink 也是因為它是一個開源的大數據計算引擎,并且有活躍的云原生社區,能夠滿足對數據的及時性要求,一致性方面有 exactly-once 語義,同時具備低延遲高吞吐量。

圖片

在線業務數據寫入流程:把源頭的數據變更放到消息隊列中去,通過索引程序將數據分發到不同的搜索引擎,同時搜索引擎也會給索引程序發送消息。

離線分析技術體系:整個離線分析技術體系比較依賴于 oss。將每日的增量數據離線放到 oss 里,對全量的數據進行一些比較復雜的分析。

離線業務數據寫入流程:數據變更會觸發持久流化至 oss,oss 同時會和歷史流進行合并在 oss 放一份全量數據。

2.3 原用戶行為分析方案

原用戶行為分析方案是非常復雜的方案,這個方案在前端有 JS 和 Java 的 API,JS 會將用戶的埋點數據放置到 Segment 中去,同時有 Gainsight 和 AMPLITUDE 兩個合成化引擎。

圖片

2.4 新用戶行為分析方案

圖片

新的用戶行為分析方案相對比較簡潔。首先收集用戶的行為數據,通過 Kinesis 以流的方式接到到 Flink,再進行一些實時指標的計算,并將計算結果存放于不同的表中,給我們提供了可視化的開發。

2.5 Flink + Iceberge 探索

在 Flink + Iceberge 的探索中,將幾百 G 左右的表以流的方式放到 Kafka 中,再推送到 oss 中。目前,市面上缺乏成熟的解決方案,所以沒有把這個方式應用到生產環境上。

圖片

03未來計劃

  • 云原生數據庫架構遷移;
  • 提供更完善的指標和取數系統;
  • 建設數據生產的全鏈路監控和預警;
  • 供支撐公司數據消費和服務能力;
  • 在線實時分析數倉及其數據處理管道的繼續演進;
  • 打造云原生數據技術體系和新一代大數據平臺;
  • 提供數據網關入口,提供統一的數據出口、提高數據應用效率。?
責任編輯:未麗燕 來源: Apache Flink
相關推薦

2019-04-15 14:06:12

2024-06-03 08:26:35

2024-12-02 09:57:43

GormScopesClauses

2013-05-15 12:20:30

NETGEAR智能家庭

2023-08-22 08:01:42

SpringBatch事務管理

2013-10-16 09:53:08

IBMPureSystemsPower Syste

2011-08-30 10:39:28

VMworld 201vmware

2024-05-20 08:08:00

分布式系統緩存C#

2024-06-06 08:58:08

大數據SQLAPI

2011-07-06 14:22:09

power平臺服務器甲骨文

2009-12-22 14:59:24

路由器故障排除

2025-04-29 08:05:00

JavaScript錯誤處理開發

2015-04-02 09:22:51

EMM深信服

2012-10-29 18:21:15

互聯汽車Red Bend

2024-06-05 09:16:54

開源工具Airflow

2018-03-23 16:49:33

銳捷網絡

2018-03-23 16:20:40

銳捷網絡

2014-03-23 17:59:01

ICT媒體華為

2010-04-20 13:37:04

2011-04-27 09:53:55

惠普打印機體驗
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美在线播放一区 | 日韩精品一区二区三区中文字幕 | 精品一区二区三区不卡 | 黄色片在线网站 | 特黄小视频 | 欧美a视频 | 97精品国产| 亚洲欧美日韩在线 | 亚洲高清在线 | 亚洲免费三级 | 99精品久久久国产一区二区三 | 亚洲最大的成人网 | 国产午夜精品视频 | 久久艹免费视频 | 久久久久久久久久久久久九 | 久热爱 | 国产成人免费视频 | 久久视频精品 | 成人在线电影在线观看 | 中文字幕一区二区不卡 | 一级片免费在线观看 | 久久不卡日韩美女 | 波多野结衣一二三区 | 91在线观看免费 | 91精品国产91久久久久久吃药 | 国产日韩av一区二区 | 亚洲激情网站 | 我我色综合 | 久久精品国产久精国产 | 国产成人精品区一区二区不卡 | 五月激情综合网 | 在线观看亚洲一区二区 | 欧美黄色网络 | 国产精品久久久久久久岛一牛影视 | 色免费视频 | 国产亚洲精品综合一区 | 久久久久久一区 | 在线观看国产视频 | 日日夜夜操天天干 | 91色啪| av网站免费观看 |