成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<style id="kbebb"><listing id="kbebb"><mark id="kbebb"></mark></listing></style>

<ruby id="kbebb"></ruby>

<sub id="kbebb"></sub>

<th id="kbebb"><abbr id="kbebb"></abbr></th>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

Snowflake性能調優的五項優秀實踐

作者：陳峻編譯 2019-07-30 09:00:00

運維數據庫運維

眾所周知，Snowflake的設計非常簡單，幾乎沒有提供有關性能調整的選項。本文為您總結了提高查詢性能的五項優秀實踐。

【51CTO.com快譯】設想一下：在沒有任何索引的情況下，以及數據庫本身并無調整選項的情況下，您會如何優化Snowflake數據倉庫呢?眾所周知，Snowflake的設計非常簡單，幾乎沒有提供有關性能調整的選項。本文為您總結了提高查詢性能的五項優秀實踐。

單獨地查詢工作負載?

最大化吞吐量、以及最小化Snowflake延遲的首選方法莫過于：對于工作負載的查詢進行分離。下圖說明了一種常見的Snowflake部署設計模式--分離工作負載(separation of workloads，請參見https://www.analytics.today/blog/what-is-the-ideal-cloud-datawarehouse-platform)。

與其他數據庫系統不同，Snowflake是針對云端構建的。它能夠有效地支持無限量的虛擬倉庫，即一些獨立大小的計算群集。它們可以對于公共數據的存儲進行共享式訪問。這種EPP(Elastic Parallel Processing，彈性并行處理，請參見https://www.analytics.today/blog/four-stages-that-revolutionised-database-architecture)的架構，可以運行復雜的數據科學類操作。在針對相同數據進行ELT加載、以及商業智能查詢時，該架構不會去爭用任何的資源。

在一般情況下，我們往往需要按照部門或團隊，來分離不同的工作負載。例如：通過為每個團隊提供屬于其自己的虛擬倉庫，來協助跟蹤團隊的使用情況。而實際上，最合適的做法應該是：按工作負載的類型，而不是用戶組來分離工作負載。這就意味著：在一個倉庫中，營銷用戶在進行商業智能類查詢的同時，我們可以運行另一個單獨的虛擬倉庫，以支持超快的財務儀表板式查詢。

曾經在一個案子中，我們有位客戶計劃運行十五個超小型的倉庫，以為每個團隊提供各自專用的計算資源。然而，在分析了使用狀況之后，我們將其改成了四個更大的虛擬倉庫。此法不但可以讓運行的成本更低，而且能夠在大幅提高性能的前提下，改善用戶的體驗。

最大化Snowflake緩存的使用

下圖展示了Snowflake是如何自動地將數據緩存到虛擬倉庫(本地的磁盤緩存)和結果緩存(Result Cache)中的。

雖然上述是一種自動化行為，但您完全可以通過如下的兩種優秀實踐，來最大限度地提高緩存的使用率，并加快查詢的性能。

首先，在分割查詢工作的負載時，您應該能夠讓用戶在同一個虛擬倉庫中查詢到相同的數據。如此，那些由某個用戶檢索到緩存里的數據，也將極有可能被其他人所使用到。

此外，您還應該避免在不使用虛擬倉庫時，草草地暫停虛擬倉庫。默認情況下，任何倉庫將在10分鐘后自動被掛起，并在有SQL語句需要被執行時才自動恢復。當然，您雖然可以將自動掛起設置為幾秒鐘，以節省資源。但是應該注意的是：在恢復之后，虛擬倉庫的緩存可能會被清空，這就意味著您將失去原先的緩存性能優勢。

最后，請注意：由于結果緩存是完全獨立于虛擬倉庫的，因此，任何用戶用其帳號執行的任何查詢，都將會從結果緩存中產生完全相同的SQL文本。

縱向擴展(Scale Up)，以適應大型工作負載

雖然這并非嚴格意義上的數據庫調優，但是利用Snowflake的虛擬倉庫功能，來擴展大型工作負載是非常重要的。

上述的SQL代碼片段說明了如何調整倉庫的大小。本例是一個能夠處理巨大工作負載的32個節點集群。在測試中，由于Snowflake維護著一個可用的資源池，因此，它需要花費幾毫秒的時間來實現部署，而在特別繁忙的時段，則可能需要幾分鐘的時間。

在處理完成之后，我們可以簡單地讓群集在300秒(即，五分鐘)之后自動掛起，或者直接在完成任務后立即暫停群集。如果需要，它可以在另一個查詢需要被執行時，自動恢復。可見，整個過程對于最終用戶的應用程序來說都是透明的。

下面的截圖顯示的是倉庫容量不佳時的指標，它包括了溢出到本地存儲(虛擬倉庫SSD)和遠程存儲的數據量。

在虛擬倉庫中，由于本地存儲始終采用的是快速SSD，因此任何無法在內存中完成的大型排序操作，都將不可避免地溢出到本地存儲之中。那么，如果您看到有大量的數據溢出到了外部存儲之中，則表明SSD存儲已經被用完，而且那些數據正在被寫入慢得多的S3或Blob存儲之中。可見，根據這兩個指標，我們應該考慮調整到一個更大的、擁有更多內存和本地SSD存儲的虛擬倉庫之中。

橫向擴展(Scale Out)并發

與上述縱向擴展不同，橫向擴展技術被用于部署一些相同大小節點的集群，以達到目標并發量，即：增加用戶的數量，而不是任務的大小或復雜性。

上面的SQL片段顯示了在部署針對多個集群的橫向擴展體系結構時，所需要的語句。此法并非部署某個大型的主機群集，而是讓Snowflake按需添加其他相同大小的群集，直至達到既定的上限。

我們在下圖中所展示的是：將商業智能虛擬倉庫配置成在其他用戶執行查詢的時候，能夠自動將群集添加到現有的配置環境之中。

顯然，這與ELT的倉庫有著明顯的差異，后者被定義為一個更大的單一化集群，用來處理復雜任務中的各種海量數據。

這種調整方法在英國食品配送服務商Deliveroo那里得到成功應用。2017年，根據最終用戶需要在近20TB的數據中，每小時開展7,000多次查詢的需求，他們使用到了Snowflake的自動化橫向擴展資源的方式。

由于并發用戶的數量在一天中的不同時段持續發生變化，因此該群集會自動暫停，以實現Deliveroo只為實際使用到的計算資源付費。下圖展示了其他群集會根據用戶的使用量，被自動添加進來，以及在不需要的時侯，自動暫停的情況。

使用數據聚合來調整Snowflake

由于使用聚合密鑰(cluster key)可以最大限度地消除分區，進而提高查詢的性能，因此對于某些大型數據表(通常超過1 TB)而言，設計人員應考慮通過定義聚合密鑰，來最大化查詢的性能。

為了說明使用聚合調整給Snowflake帶來的性能優勢，我們針對TPC(Transaction Processing Council)表的STORE_SALES設置了一項基準測試，該表容量有1.3Tb，其中保存了近300億行銷售數據。接著，我們針對該表的聚合版本和非聚合版本，運行了相同的查詢，下圖是兩項結果的對比。

通過在SS_SOLD_DATE_SK列上放置聚合密鑰，并按日期進行過濾，整體查詢的運行速度提高了14倍，并且只掃描了近1/30的數據。

下面的圖表進一步說明了Snowflake聚合的效果，其中涉及到的數據是在語句中對WHERE by DATE進行過濾后產生的。

由于數據是按照日期進行加載的，因此它們往往能夠自然聚集，即同一天的所有數據都屬于同一個微分區。但是，如果執行以下SQL語句，Snowflake將會把所有銷售日期都保留在同一個微分區中。而在需要時，后臺任務將自動重新聚類數據，并將用到的計算處理資源按照單獨的項目進行計費。

由于Snowflake掌握了每個微分區中、每列的最小和最大值，因此它可以直接跳過那些與查詢條件完全不匹配的微分區。為了演示該聚合的性能效果，我們創建了一個包含有6億行和16Gb壓縮數據的表。該表由一個唯一性的密鑰(ORDER_KEY)所標識，因此我們將其表示為聚類密鑰。

通過執行上述查詢，我們在6億行的正好中間找到了目標記錄，其返回的時間為88毫秒。如下面的Snowflake Query Profiler截圖所示，速度快的主要原因在于：該查詢只掃描了整個16Gb壓縮數據中的1.5Mb，而且除了一個微分區之外，它幾乎跳過了所有不相關的內容。

可見，只要使用到了聚類密鑰，Snowflake就能夠跳過多達99.91%的數據，進而避免了任何與需要維護傳統索引相關的性能、以及數據管理的開銷。

結論

綜上所述，雖然可供調整Snowflake性能的選項寥寥無幾，但是我們可以通過上述優秀實踐來最大化查詢的性能、以及吞吐量。

原文標題：Snowflake Performance Tuning: Top 5 Best Practices，作者：John Ryan

【51CTO譯稿，合作站點轉載請注明原文譯者和出處為51CTO.com】

責任編輯：龐桂玉來源： 51CTO

Snowflake 數據庫性能調優

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：久久婷婷麻豆国产91天堂 | 国产粉嫩尤物极品99综合精品 | 日本电影韩国电影免费观看 | 欧美久久视频 | 日韩精品视频在线观看一区二区三区 | 中文精品视频 | 日韩欧美一区二区在线播放 | 一级免费视频 | 成人免费福利视频 | 久久中文字幕一区 | 国产成人av在线 | 国产精品18毛片一区二区 | 成人av一区二区在线观看 | 国产精品乱码一区二三区小蝌蚪 | 亚洲国产一区二区三区 | 午夜免费看视频 | 亚洲国产精品久久久 | 天天爽天天干 | 久久三级av | 毛片免费观看视频 | 91精品久久久久久久99 | 精品国产乱码久久久久久丨区2区 | 午夜影院黄 | 精品国产1区2区3区在线国产视频 | 欧美日韩精品久久久免费观看 | 国产午夜精品久久久久 | 成人毛片视频免费 | 亚洲视频在线一区 | 日韩乱码在线 | 欧美成人一级 | 日本黄色大片免费 | 欧美第一页 | 亚洲精品久久久久久久久久久久久 | 国产精品久久久久久久久久 | 岛国毛片在线观看 | 午夜精品一区二区三区在线视频 | 日日干日日操 | 久久99网 | 国产中文一区二区三区 | 国产中文字幕av | 国产精品一区二区三区久久 |

<th id="ppyxl"></th>

<style id="ppyxl"></style>