成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

網(wǎng)易有數(shù) BI 圖表查詢(xún)性能優(yōu)化實(shí)踐

大數(shù)據(jù)
本文將介紹有數(shù) BI 在圖表查詢(xún)性能方面的優(yōu)化和實(shí)踐,包括有數(shù) BI 圖表的數(shù)據(jù)查詢(xún)?cè)恚约皩?duì)圖表查詢(xún)過(guò)程進(jìn)行的相關(guān)優(yōu)化。

一、有數(shù) BI 圖表的數(shù)據(jù)查詢(xún)?cè)?/span>

1、可視化的數(shù)據(jù)分析流程

可視化的數(shù)據(jù)分析流程,主要分成三部分:數(shù)據(jù)接入、數(shù)據(jù)建模和報(bào)告制作。

圖片

(1)數(shù)據(jù)接入

目前有數(shù)已經(jīng)支持 30 多種數(shù)據(jù)源,且支持多種數(shù)據(jù)源類(lèi)型,包含關(guān)系型數(shù)據(jù)庫(kù)、分布式數(shù)據(jù)庫(kù)、restAPI、數(shù)據(jù)表單等。

(2)數(shù)據(jù)建模

數(shù)據(jù)接入后,我們就可以進(jìn)行數(shù)據(jù)建模。

目前我們支持通過(guò)拖拽式的 Join/Union 建模,如果用戶(hù)有復(fù)雜需求,也可以通過(guò)自定義 SQL 方式建模。另外我們也具備計(jì)算字段的能力,可以進(jìn)行一些計(jì)算字段的擴(kuò)展。同時(shí),我們也支持字段元信息定義,比如字段類(lèi)型、指標(biāo)口徑等等。

(3)報(bào)告制作

數(shù)據(jù)模型建好了,就可以進(jìn)行拖拽式的報(bào)告制作。

目前我們支持豐富的圖表庫(kù)以及強(qiáng)大的分析能力,讓用戶(hù)做報(bào)告就像制作 PPT 一樣簡(jiǎn)單。同時(shí),用戶(hù)也可以把做好的報(bào)告通過(guò)移動(dòng)端、微信小程序、分享鏈接等形式分享出去,進(jìn)行數(shù)據(jù)的分發(fā)和共享。

2、圖表背后的數(shù)據(jù)查詢(xún)和處理技術(shù)

圖片

(1)Query DSL:圖表數(shù)據(jù)查詢(xún)語(yǔ)言

首先圖表配置好以后會(huì)先生成 Query DSL(圖表數(shù)據(jù)查詢(xún)語(yǔ)言),它包含模型依賴(lài)的數(shù)據(jù)源連接信息、寬表信息以及用戶(hù)拖上去的維度、度量、篩選、排序等等。

(2)所有操作都可以轉(zhuǎn)換成 Query DSL

用戶(hù)配置的圖表最終都能轉(zhuǎn)換成一套 Query DSL。

(3)抽象語(yǔ)法樹(shù)的生成

有了 Query DSL,就可以生成對(duì)應(yīng)的 AST(抽象語(yǔ)法樹(shù)),它包含 Table 節(jié)點(diǎn)、Select 節(jié)點(diǎn)、From 節(jié)點(diǎn)、Group By 節(jié)點(diǎn)和一些計(jì)算節(jié)點(diǎn)等。

(4)SQL 語(yǔ)法適配:屏蔽數(shù)據(jù)源差異

有了抽象語(yǔ)法樹(shù),我們就可以針對(duì)不同的數(shù)據(jù)源進(jìn)行 SQL 的適配,然后從不同的數(shù)據(jù)源將數(shù)據(jù)查詢(xún)回來(lái)并返回給用戶(hù)。這樣,對(duì)于用戶(hù)來(lái)說(shuō)是不需要感知到底層數(shù)據(jù)源的類(lèi)型的。

3、圖表查詢(xún)核心能力

圖片

首先,最基礎(chǔ)的部分,支持排序、篩選、聚合、數(shù)據(jù)字典、計(jì)算字段和分組字段等等。

另外,支持圖表聯(lián)動(dòng)、上卷下鉆、地圖計(jì)算等強(qiáng)大的分析能力。

同時(shí),還支持行列權(quán)限(同一個(gè)圖表不同用戶(hù)看到不同數(shù)據(jù))以及跨視圖粒度分析(同一張圖表可以看到不同聚合粒度的數(shù)據(jù))的能力。

最后總結(jié)下,前面講到的圖表提供的一些能力,背后的核心其實(shí)都是對(duì)數(shù)據(jù)字段行為的處理,比如我們常用的聚焦下鉆,當(dāng)點(diǎn)擊地區(qū) = “東北”這個(gè)柱子下鉆下去看下東北下面各個(gè)省份求和銷(xiāo)售額的分布,其實(shí)背后的處理行為就是,我們會(huì)把 x 軸的維度字段從地區(qū)轉(zhuǎn)換為省份,然后再加一個(gè)地區(qū) = “東北”的字段篩選器,所以這里聚焦下鉆其實(shí)背后被轉(zhuǎn)換成了兩個(gè)對(duì)字段行為的處理,最后這些字段都會(huì)轉(zhuǎn)換成統(tǒng)一的語(yǔ)法樹(shù)。

圖片

二、有數(shù) BI 智能緩存的設(shè)計(jì)和實(shí)現(xiàn)

前面我們講到,針對(duì)用戶(hù)配置的圖表會(huì)對(duì)應(yīng)生成 SQL,然后去對(duì)應(yīng)的落庫(kù)查詢(xún)。整個(gè)查詢(xún)過(guò)程有以下幾個(gè)特點(diǎn):

① 高并發(fā):早上看數(shù)高峰期。

② 大數(shù)據(jù)量:很多千萬(wàn)、億級(jí)數(shù)據(jù)查詢(xún)場(chǎng)景。

③ 離線數(shù)據(jù):大部分都是 T + 1 的數(shù)據(jù)。

針對(duì)以上特點(diǎn)最有效的手段就是通過(guò)緩存去解決,可以看到下圖是我們線上最近一個(gè)月的查詢(xún)耗時(shí)對(duì)比(綠色線表示落庫(kù)查詢(xún)、紅色線表示緩存查詢(xún)),很明顯命中緩存以后查詢(xún)效率可以有上百倍的提升。

圖片

那么,圖表緩存的是什么數(shù)據(jù)呢?

答案是圖表數(shù)據(jù)。

這里可能很多同學(xué)會(huì)問(wèn),為什么不緩存模型數(shù)據(jù)?

首先,模型數(shù)據(jù)可能較大;其次,當(dāng)緩存模型數(shù)據(jù)時(shí),圖表查詢(xún)時(shí)依然需要進(jìn)行二次聚合運(yùn)算,因此也存在一定的計(jì)算成本。

圖片

可以看到我們緩存的對(duì)象由圖表和用戶(hù)組成,這里的主要原因是由于前面講到的同一圖表不同用戶(hù)可以看到不同數(shù)據(jù),因此一個(gè)圖表會(huì)存在多份緩存。

除此之外,我們還引入了二級(jí)緩存的概念。

一級(jí)緩存,主要緩存前端圖表通過(guò) queryData 查詢(xún)出來(lái)的數(shù)據(jù)。

二級(jí)緩存,主要緩存生成的 SQL 查詢(xún)出來(lái)的數(shù)據(jù),同時(shí),二級(jí)緩存可以實(shí)現(xiàn)緩存復(fù)用,例如:同一套數(shù)據(jù)展示成折線圖和柱狀圖,雖然他們的展示形式不同,但底層生成的 SQL 是一樣的,此時(shí)就可以復(fù)用二級(jí)緩存。

下圖展示了智能緩存的整體架構(gòu)。

圖片

第一層是調(diào)度器:包括緩存的刷新計(jì)劃、OpenAPI、表產(chǎn)出訂閱、MPP 抽取和手動(dòng)觸發(fā)。

第二層是運(yùn)算器:包括數(shù)據(jù)產(chǎn)出驅(qū)動(dòng)、圖表血緣計(jì)算、用戶(hù)查詢(xún)行為分析和基于 ROI 的優(yōu)先級(jí)計(jì)算。

第三層是執(zhí)行器:通過(guò)運(yùn)算器會(huì)生產(chǎn)一個(gè)緩存對(duì)象,緩存對(duì)象就會(huì)被放入隊(duì)列進(jìn)行排隊(duì)執(zhí)行,最終生成緩存的數(shù)據(jù)。 

另外,我們我們還會(huì)實(shí)時(shí)地監(jiān)控緩存數(shù)據(jù),進(jìn)行一些緩存的監(jiān)控和報(bào)警。

接下來(lái),我們看一下緩存運(yùn)算器中的基于數(shù)據(jù)產(chǎn)出驅(qū)動(dòng)緩存的原理。

圖片

因?yàn)榇蟛糠謹(jǐn)?shù)據(jù)是 T+1 離線數(shù)據(jù),因此這里也是以天為單位進(jìn)行實(shí)現(xiàn)。它的輸入是離線表的產(chǎn)出消息,當(dāng)消息推送過(guò)來(lái)時(shí),我們可以根據(jù)圖表的血緣關(guān)系找到該表關(guān)聯(lián)的圖表,然后對(duì)圖表進(jìn)行緩存。

當(dāng)然,有些表不是每天都有產(chǎn)出任務(wù)的,因此這里我們引入了產(chǎn)出預(yù)測(cè)模塊。它可以根據(jù)數(shù)據(jù)任務(wù)的調(diào)度信息計(jì)算出某個(gè)表今天有沒(méi)有產(chǎn)出,另外還可以根據(jù)表產(chǎn)出歷史推測(cè)出今天該表有沒(méi)有產(chǎn)出。

該方式的優(yōu)點(diǎn)是可以提升緩存效率,進(jìn)行錯(cuò)峰緩存,從而保障緩存的實(shí)時(shí)性和有效性。

它的應(yīng)用場(chǎng)景有三點(diǎn):

① 一是與有數(shù)數(shù)據(jù)中臺(tái)的數(shù)據(jù)服務(wù)打通,天然就具備了這個(gè)能力。

② 二是內(nèi)置 MPP 抽取完進(jìn)行數(shù)據(jù)驅(qū)動(dòng),例如物化視圖完或數(shù)據(jù)抽取完以后可以實(shí)時(shí)觸發(fā)緩存。

③ 三是用戶(hù)可以通過(guò)調(diào)用 API 的方式,主動(dòng)觸發(fā)緩存。

下面介紹緩存運(yùn)算器的原理。

圖片

這里主要講四點(diǎn):

第一點(diǎn)是用戶(hù)行為分析:用戶(hù)在打開(kāi)報(bào)告后,會(huì)默認(rèn)進(jìn)行一些篩選,然后用戶(hù)可以進(jìn)行篩選器切換、圖表聯(lián)動(dòng)、圖表跳轉(zhuǎn)等行為,此時(shí)隨著圖表的變換,緩存數(shù)據(jù)也會(huì)隨之變動(dòng)。因此,用戶(hù)行為分析是希望從中找出規(guī)律,提高用戶(hù)行為分析時(shí)的緩存命中率。

第二點(diǎn)是 QueryData:QueryData 是圖表的查詢(xún)請(qǐng)求輸入,它主要分為兩類(lèi),一類(lèi)是圖表默認(rèn)的 QueryData;另一類(lèi)是根據(jù)圖表歷史分析行為采集器生成的 QueryData,它可能有很多份,我們會(huì)選取 TopN 進(jìn)行緩存。

第三點(diǎn)是權(quán)限判斷:因?yàn)橛脩?hù)權(quán)限每天可能發(fā)生變化,因此我們會(huì)結(jié)合用戶(hù)的資源權(quán)限和數(shù)據(jù)權(quán)限,最終選取 TopN 的用戶(hù)進(jìn)行緩存。

第四點(diǎn)是優(yōu)先級(jí)計(jì)算:可以看到我們這里是根據(jù) ROI 算法進(jìn)行緩存的優(yōu)先級(jí)判斷的,計(jì)算因子包括 PV、UV、產(chǎn)出頻率等等,最終計(jì)算出每一個(gè)用戶(hù)和 queryData 的優(yōu)先級(jí)。

除此之外,我們可以計(jì)算出:緩存總數(shù)量 = 用戶(hù)數(shù)量 * queryData 數(shù)量。

下面是我們?cè)谠埔魳?lè)環(huán)境下緩存實(shí)踐效果統(tǒng)計(jì):

① 首次緩存命中率從 35% 提高到 93%+。

② 整體緩存命中率從 70% 提高到 92%+。

③ 5 秒內(nèi)頁(yè)面響應(yīng)占比從 70% 提高到 90%+。

圖片

下面是用戶(hù)行為分析緩存的統(tǒng)計(jì),可看到用戶(hù)行為分析緩存命中率從 35% 提高到 80%+,效果比較明顯。

圖片

三、圖表查詢(xún)的合并和優(yōu)化

下圖是一個(gè)報(bào)告的示例,可以看到該報(bào)告可能包含上百個(gè)圖表,且每個(gè)圖表都會(huì)產(chǎn)生一到多個(gè) SQL 查詢(xún),而整體并發(fā) SQL 查詢(xún)?cè)蕉啵w查詢(xún)也就越慢。通過(guò)對(duì)比 SQL 分析,可以發(fā)現(xiàn)大部分 SQL 只是 select 字段不一樣,where 和 group by 等條件可能都一樣,那么對(duì)于這種查詢(xún)就可以進(jìn)行查詢(xún)合并。

圖片

圖表查詢(xún)的合并和優(yōu)化是通過(guò)查詢(xún)視圖的構(gòu)建來(lái)實(shí)現(xiàn)的。

首先我們以報(bào)告為粒度進(jìn)行查詢(xún)視圖的構(gòu)建,一份報(bào)告對(duì)應(yīng)多個(gè)查詢(xún)視圖,一個(gè)查詢(xún)視圖可以承載多個(gè)圖表的查詢(xún),查詢(xún)視圖的聚合規(guī)則包含:Filter、Dimensions、Sorters 等。

假設(shè)一個(gè)報(bào)告內(nèi) Query DSL 有 N 個(gè),Query DSL View 有 M 個(gè),那么 N/M 越大,查詢(xún)視圖的價(jià)值就越大。

圖片

接下來(lái)我們介紹一下查詢(xún)視圖的查詢(xún)流程優(yōu)化:

首先,前端輸入一個(gè) Query Data,我們會(huì)找到對(duì)應(yīng)的原始的 Query DSL,然后生成對(duì)應(yīng)的查詢(xún)視圖,然后進(jìn)行重組生成一個(gè)新的 Query DSL,新的 Query DSL 返回?cái)?shù)據(jù)的時(shí)候,也會(huì)對(duì)查詢(xún)結(jié)果進(jìn)行反向還原。

然后 Query DSL 會(huì)經(jīng)過(guò)緩存模塊進(jìn)行處理,這里有一個(gè)好處就是,多個(gè)相似圖表的緩存可以進(jìn)行復(fù)用,從而減少緩存數(shù)據(jù)大小和預(yù)緩存次數(shù)。

如果沒(méi)有命中緩存,請(qǐng)求會(huì)經(jīng)過(guò)我們的查詢(xún)攔截器,攔截器可以保證同一個(gè)查詢(xún)視圖的請(qǐng)求只會(huì)下發(fā)一次。

以上的整個(gè)過(guò)程對(duì)前端來(lái)說(shuō)是透明的,前端無(wú)需感知整個(gè)查詢(xún)過(guò)程。

圖片

下面是圖表查詢(xún)合并后的實(shí)踐效果:

其中 13000 多個(gè)查詢(xún)視圖可以承載 84000 多個(gè)查詢(xún),也就是 N/M≈1:7。

其中每日落庫(kù)查詢(xún)量從 7000 次下降到 3000 次左右,效果比較明顯。 

圖片

四、圖表查詢(xún)的其他優(yōu)化

1、維值加速

下圖是一家客戶(hù)的查詢(xún)報(bào)告,可以看到其中篩選器數(shù)量非常多,并且是根據(jù)明細(xì)數(shù)據(jù)進(jìn)行去重聚合的,其查詢(xún)也相對(duì)頻繁,查詢(xún)出來(lái)的成員較少且是固定的,此時(shí)我們可以通過(guò)維值加速進(jìn)行優(yōu)化。

圖片

我們可以通過(guò)以下幾種方式進(jìn)行維值加速:

動(dòng)態(tài)值:可以把被查詢(xún)的字段綁定到單獨(dú)的維表字段上,最終查詢(xún)篩選器數(shù)據(jù)時(shí)實(shí)際上查的是對(duì)應(yīng)維表的數(shù)據(jù)。

靜態(tài)值:對(duì)于靜態(tài)值,可以直接對(duì)查詢(xún)字段設(shè)置枚舉,例如:性別的男、女等。

總體思路是減少對(duì)于明細(xì)表高頻且耗時(shí)的聚合查詢(xún)。

2、分區(qū)篩選器優(yōu)化

因?yàn)榇蟛糠謹(jǐn)?shù)據(jù)源都具備分區(qū)概念,如果能命中分區(qū)索引,就可以減少全表掃描,從而提升查詢(xún)速度。

這里的分區(qū)查詢(xún)篩選器優(yōu)化,是結(jié)合了有數(shù)數(shù)據(jù)中臺(tái)元數(shù)據(jù)中心,去獲取對(duì)應(yīng)表的分區(qū)字段,從而生成分區(qū)篩選器。當(dāng)圖表在查詢(xún)的時(shí)候,我們會(huì)動(dòng)態(tài)的獲取分區(qū)篩選器的最近分區(qū),同時(shí)會(huì)進(jìn)行分區(qū)篩選的強(qiáng)制下推,從而提升查詢(xún)性能。

圖片

分區(qū)篩選器有以下兩個(gè)特點(diǎn):

第一是由建模人員決定是否使用分區(qū)篩選器,這樣可以規(guī)范分析師的使用流程。

第二是報(bào)告必須繼承模型分區(qū)篩選器,同時(shí)不能進(jìn)行刪除。

圖片

3、查詢(xún)分級(jí)優(yōu)化

查詢(xún)分級(jí)優(yōu)化主要從四個(gè)方面介紹:

(1)查詢(xún)分流

針對(duì)不同場(chǎng)景使用不同查詢(xún)引擎,比如使用 Impala 數(shù)據(jù)源時(shí)支持使用 Spark 進(jìn)行抽取和導(dǎo)出 Excel 相關(guān)查詢(xún)。

(2)高低優(yōu)先級(jí)查詢(xún)隊(duì)列

控制同一個(gè)數(shù)據(jù)源的并發(fā) SQL。

優(yōu)先保障重點(diǎn)用戶(hù)(例如老板等)的看數(shù)需求等。

(3)重點(diǎn)報(bào)告/普通報(bào)告

重點(diǎn)報(bào)告優(yōu)先緩存。

重點(diǎn)報(bào)告支持單獨(dú)切換數(shù)據(jù)連接,比如 Impala 數(shù)據(jù)源可以走不同的分組。

(4)VIP 查詢(xún)服務(wù)

部分報(bào)告的查詢(xún)走單獨(dú)的后端服務(wù);

資源隔離,保障可用性。

圖片

4、前端渲染優(yōu)化

主要包括以下三個(gè)方面:

① 查詢(xún)組件分級(jí):例如圖表及 topN 篩選器可以進(jìn)行高優(yōu)先級(jí)加載,圖片和普通篩選器做低優(yōu)先級(jí)加載。

② 局部渲染優(yōu)化:優(yōu)先渲染視窗內(nèi)的組件,非可視區(qū)域進(jìn)行懶加載。

③ 請(qǐng)求隊(duì)列控制:前端做了請(qǐng)求隊(duì)列的控制,減少查詢(xún)并發(fā),從而避免一個(gè)用戶(hù)就把數(shù)據(jù)源資源吃光。

圖片

5、SQL 生成優(yōu)化

第五個(gè)就是我們會(huì)對(duì)第一章的講到的 Query DSL 去生成 SQL 這個(gè)過(guò)程也做了一些通用的優(yōu)化,比如篩選條件等價(jià)下推,Join 條件篩選傳遞,動(dòng)態(tài)模型剪枝等優(yōu)化。這些優(yōu)化都會(huì)對(duì)特定場(chǎng)景的查詢(xún)有較大的優(yōu)化效果,右邊這個(gè)圖是我們字段類(lèi)型轉(zhuǎn)換做篩選的優(yōu)化效果圖,雖然該字段做了類(lèi)型轉(zhuǎn)換,其實(shí)我們也可以背后讓他用原始的類(lèi)型進(jìn)行篩選,提高查詢(xún)效率。

圖片

6、MPP 查詢(xún)加速

對(duì)于一些異構(gòu)數(shù)據(jù)源,我們可以通過(guò)數(shù)據(jù)抽取、數(shù)據(jù)準(zhǔn)備、物化視圖等方式,將數(shù)據(jù)抽取到 MPP 數(shù)倉(cāng),達(dá)到查詢(xún)加速的目的。

圖片

五、圖表的性能查詢(xún)分析和診斷

前面我們介紹了很多圖表查詢(xún)性能優(yōu)化的方式和方法,但是并不能解決所有的性能問(wèn)題,新的性能問(wèn)題總是會(huì)不斷的產(chǎn)生。同時(shí),有數(shù) BI 的圖表查詢(xún)鏈路也較長(zhǎng),性能排查過(guò)程耗時(shí)耗力。雖然我們提供了很多圖表性能的優(yōu)化手段,分析師具體該如何選擇也是問(wèn)題。

我們做性能分析和診斷的目標(biāo)是:

① 幫助用戶(hù)快速定位問(wèn)題。

② 輸出準(zhǔn)確的方案。

③ 直接賦能用戶(hù)自我解決問(wèn)題。

這個(gè)功能在我們產(chǎn)品功能上叫做“數(shù)據(jù)醫(yī)生”,下面是我們數(shù)據(jù)醫(yī)生實(shí)現(xiàn)的方案:

① 第一步是根據(jù)性能統(tǒng)計(jì),發(fā)現(xiàn)到底是哪個(gè)圖表慢。

② 第二步是找到某個(gè)具體圖表以后我們可以進(jìn)行全鏈路 timeline 計(jì)算和分析。

③ 第三步結(jié)合我們?cè)\斷的規(guī)則庫(kù),推斷具體問(wèn)題原因。

④ 第四步針對(duì)不同的問(wèn)題,給出不同的解決方案。

圖片

另外我們還專(zhuān)門(mén)做了一層統(tǒng)一的針對(duì) SQL profile 的性能解析層,會(huì)把不同數(shù)據(jù)源的 profile 進(jìn)行統(tǒng)一的抽象,比如統(tǒng)計(jì) SQL 的資源消耗,分區(qū)、存儲(chǔ)格式等表的元信息,另外會(huì)對(duì) Join 或者 Scan 算子的性能進(jìn)行定義和解析,目前我們已經(jīng)適配了 Impala 和 Clickhouse 兩種數(shù)據(jù)源,右邊是我們針對(duì)這個(gè)抽象的 SQL 粒度的性能解析在產(chǎn)品上的診斷結(jié)果的體現(xiàn),我們會(huì)告知用戶(hù)哪些表的掃描數(shù)據(jù)比較慢,哪些 Join 節(jié)點(diǎn)的計(jì)算比較慢,這樣用戶(hù)就很方便的發(fā)現(xiàn)具體的問(wèn)題。

圖片

數(shù)據(jù)醫(yī)生自助幫助用戶(hù)解決了基本的性能問(wèn)題,釋放了技術(shù)支持和開(kāi)發(fā)的人力。同時(shí)我們的診斷規(guī)則和經(jīng)驗(yàn)也在不斷持續(xù)積累。

圖片

六、總結(jié)

最后來(lái)做一個(gè)簡(jiǎn)單的總結(jié)。

(1)性能是 BI 產(chǎn)品的有理保障和核心競(jìng)爭(zhēng)力,性能是保障用戶(hù)體驗(yàn)的根基。

(2)解決性能問(wèn)題一定要從用戶(hù)使用場(chǎng)景出發(fā),具體問(wèn)題具體分析。

(3)提效和易用:盡可能地賦能用戶(hù)自助解決問(wèn)題的能力,提升產(chǎn)品效率和易用性。

圖片

七、問(wèn)答環(huán)節(jié)

Q1:緩存是行列級(jí)別的嗎?

A1:我們的緩存是緩存一份圖表的數(shù)據(jù),所以一個(gè)圖表看能有多份緩存,不同用戶(hù)不同權(quán)限看到圖表數(shù)據(jù)可能不一樣,同時(shí)我們也會(huì)對(duì)相同權(quán)限的用戶(hù)進(jìn)行去重和合并。

Q2:MPP 查詢(xún)負(fù)載打滿后怎么處理?

A2:MPP 這邊我們有專(zhuān)人進(jìn)行維護(hù),會(huì)對(duì) MPP 數(shù)據(jù)庫(kù)的查詢(xún)進(jìn)行監(jiān)控和告警,同時(shí)我們也會(huì)對(duì) MPP 進(jìn)行一些治理,例如:發(fā)現(xiàn)一些大查詢(xún)我們會(huì)進(jìn)行攔截等。

Q3:查詢(xún)合并只針對(duì)指標(biāo)卡嗎?還是所有圖表類(lèi)型都會(huì)進(jìn)行合并?

A3:查詢(xún)合并目前最主要還是指標(biāo)卡的應(yīng)用場(chǎng)景,其他場(chǎng)景我們后面也會(huì)慢慢支持。

Q4:請(qǐng)問(wèn)數(shù)據(jù)存儲(chǔ)最終是存儲(chǔ)到 MPP 里面的嗎?還是說(shuō)支持外部?

A4:對(duì)于有數(shù) BI 來(lái)說(shuō),我們的圖表查詢(xún)是落到 MPP 數(shù)倉(cāng)里面。對(duì)于外部數(shù)倉(cāng)來(lái)說(shuō),我們支持 ETL 數(shù)據(jù)準(zhǔn)備能力,進(jìn)行一個(gè)數(shù)據(jù)清洗,可以把我們的數(shù)據(jù)準(zhǔn)備清洗到外部數(shù)據(jù)庫(kù),目前 ETL 外部數(shù)據(jù)庫(kù)已經(jīng)支持 MySQL、Doris 等,然后用戶(hù)可以通過(guò)建立數(shù)據(jù)連接在有數(shù) BI 上進(jìn)行查詢(xún)和分析。

Q5:目前的性能診斷的數(shù)據(jù)醫(yī)生,對(duì)于優(yōu)化性能最大的是哪種手段?

A5:對(duì)于數(shù)據(jù)醫(yī)生來(lái)說(shuō),只是診斷工具,并不是用來(lái)提升性能的。具體性能的提升,還是要通過(guò)物化視圖、維值加速、分區(qū)篩選等手段進(jìn)行,物化視圖目前的性能提升相對(duì)較大。

Q6:查詢(xún)視圖與物化視圖如何區(qū)分與使用?

A6:查詢(xún)視圖其實(shí)是物化視圖前面的部分,為了構(gòu)建 Query DSL 的輸入,請(qǐng)求的鏈路到達(dá)查詢(xún)器,才會(huì)命中后面的物化視圖。

責(zé)任編輯:姜華 來(lái)源: DataFunTalk
相關(guān)推薦

2023-05-15 07:42:10

2024-03-19 09:24:00

大數(shù)據(jù)數(shù)據(jù)分析性能優(yōu)化

2022-04-28 15:34:00

應(yīng)用優(yōu)化實(shí)踐

2020-03-23 15:15:57

MySQL性能優(yōu)化數(shù)據(jù)庫(kù)

2023-08-17 15:06:06

網(wǎng)易數(shù)帆ChatBIBI

2010-07-06 09:07:09

2020-07-17 19:55:50

Vue前端性能優(yōu)化

2023-07-27 07:44:07

云音樂(lè)數(shù)倉(cāng)平臺(tái)

2022-10-28 13:41:51

字節(jié)SDK監(jiān)控

2019-08-02 11:28:45

HadoopYARN調(diào)度系統(tǒng)

2021-09-24 14:02:53

性能優(yōu)化實(shí)踐

2018-06-07 08:54:01

MySQL性能優(yōu)化索引

2022-03-29 13:27:22

Android優(yōu)化APP

2014-03-19 14:34:06

JQuery高性能

2017-03-01 20:53:56

HBase實(shí)踐

2012-12-24 09:55:15

JavaJava WebJava優(yōu)化

2022-07-08 09:38:27

攜程酒店Flutter技術(shù)跨平臺(tái)整合

2016-11-17 09:00:46

HBase優(yōu)化策略

2022-07-15 09:20:17

性能優(yōu)化方案

2025-01-21 14:00:00

Golang數(shù)據(jù)結(jié)構(gòu)struct
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 精品亚洲一区二区 | 成人国产a | 精品一区二区视频 | 国产在线观看一区二区 | 91成人在线视频 | 亚洲av毛片| 免费国产一区 | 中文字幕第十五页 | 国产免费一区二区三区 | www国产成人免费观看视频,深夜成人网 | 99久久精品免费 | 亚洲视频在线一区 | 亚洲日韩中文字幕一区 | av黄色在线 | 中文字幕在线第一页 | a级大片 | 欧美aaaaaaaa| 亚洲天堂久久新 | 日韩在线免费视频 | 国产精品99久久久久久人 | 久久一久久| www.亚洲成人网 | 久久精品青青大伊人av | 国内自拍偷拍 | 久久精品69| 国产亚洲精品美女久久久久久久久久 | 97av视频| 狠狠操网站 | 久久精品国产一区二区电影 | 超碰地址 | 91网视频| 日本黄色免费片 | 99久久精品国产一区二区三区 | 日韩在线视频免费观看 | 盗摄精品av一区二区三区 | 一区二区三区亚洲 | 午夜精品三区 | 日韩电影中文字幕 | 一区二区免费高清视频 | 精产嫩模国品一二三区 | 精品国产视频 |