成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Spark SQL優化策略

企業動態 Spark
查詢優化是傳統數據庫中最為重要的一環,這項技術在傳統數據庫中已經很成熟。除了查詢優化,Spark SQL在存儲上也進行了優化。下面介紹Spark SQL的一些優化策略。

查詢優化是傳統數據庫中最為重要的一環,這項技術在傳統數據庫中已經很成熟。除了查詢優化,Spark SQL在存儲上也進行了優化。

下面介紹Spark SQL的一些優化策略。

[[178956]]

(1)內存列式存儲與內存緩存表

Spark SQL可以通過cacheTable將數據存儲轉換為列式存儲,同時將數據加載到內存緩存。cacheTable相當于在分布式集群的內存物化視圖,將數據緩存,這樣迭代的或者交互式的查詢不用再從HDFS讀數據,直接從內存讀取數據大大減少了I/O開銷。列式存儲的優勢在于Spark SQL只需要讀出用戶需要的列,而不需要像行存儲那樣每次都將所有列讀出,從而大大減少內存緩存數據量,更高效地利用內存數據緩存,同時減少網絡傳輸和I/O開銷。數據按照列式存儲,由于是數據類型相同的數據連續存儲,所以能夠利用序列化和壓縮減少內存空間的占用。

(2)列存儲壓縮

為了減少內存和硬盤空間占用,Spark SQL采用了一些壓縮策略對內存列存儲數據進行壓縮。Spark SQL的壓縮方式要比Shark豐富很多,如它支持PassThrough、RunLengthEncoding、DictionaryEncoding、BooleanBitSet、IntDelta、LongDelta等多種壓縮方式,這樣能夠大幅度減少內存空間占用、網絡傳輸和I/O開銷。

(3)邏輯查詢優化

SparkSQL在邏輯查詢優化(見圖8-4)上支持列剪枝、謂詞下壓、屬性合并等邏輯查詢優化方法。列剪枝為了減少讀取不必要的屬性列、減少數據傳輸和計算開銷,在查詢優化器進行轉換的過程中會優化列剪枝。

下面介紹一個邏輯優化的例子。

SELECT Class FROM (SELECT ID,Name,Class FROM STUDENT ) S WHERE S.ID=1

Catalyst將原有查詢通過謂詞下壓,將選擇操作ID=1優先執行,這樣過濾大部分數據,通過屬性合并將***的投影只做一次,最終保留Class屬性列。

(4)Join優化

Spark SQL深度借鑒傳統數據庫的查詢優化技術的精髓,同時在分布式環境下調整和創新特定的優化策略。現在Spark SQL對Join進行了優化,支持多種連接算法,現在的連接算法已經比Shark豐富,而且很多原來Shark的元素也逐步遷移過來,如BroadcastHashJoin、BroadcastNestedLoopJoin、HashJoin、LeftSemiJoin,等等。

下面介紹其中的一個Join算法。

BroadcastHashJoin將小表轉化為廣播變量進行廣播,這樣避免Shuffle開銷,***在分區內做Hash連接。這里使用的就是Hive中Map Side Join的思想,同時使用DBMS中的Hash連接算法做連接。 隨著Spark SQL的發展,未來會有更多的查詢優化策略加入進來,同時后續Spark SQL會支持像Shark Server一樣的服務端和JDBC接口,兼容更多的持久化層,如NoSQL、傳統的DBMS等。一個強有力的結構化大數據查詢引擎正在崛起。

【本文為51CTO專欄作者“王森豐”的原創稿件,轉載請注明出處】

責任編輯:趙寧寧 來源: 神算子
相關推薦

2021-07-16 23:01:03

SQL索引性能

2021-07-26 18:23:23

SQL策略優化

2023-05-10 10:30:02

性能優化Tomcat

2023-03-30 09:06:20

HiveSpark大數據

2019-01-22 08:45:57

SQL語句策略

2025-02-18 08:10:00

SQL數據表數據庫

2016-12-14 19:20:07

Spark SQL架構分布式

2009-09-08 09:45:23

App Engine性

2011-07-25 18:03:12

組策略

2016-12-08 15:47:54

sql優化數據

2024-05-08 10:59:04

云計算AI優化云策略

2021-03-29 23:12:51

機器學習人工智能游戲

2025-01-15 08:05:06

MySQLLEFT JOIN數據庫

2014-03-11 15:47:29

大型網站速度優化運維人員

2023-07-26 15:46:26

數據中心數據存儲

2024-07-26 07:59:25

2016-11-17 09:00:46

HBase優化策略

2023-05-26 18:52:55

2011-07-03 18:44:45

網站優化

2024-08-06 10:02:42

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品一区一区三区 | 日韩精品一区二区三区第95 | 亚洲免费精品 | 日本精品一区二区 | 精品国产乱码久久久久久蜜退臀 | 欧美日韩在线视频一区 | 色天堂视频 | 日韩一区二区三区在线观看 | 国产精品一区二区在线 | 精品成人av | 性色av网站 | 欧美精品日韩精品国产精品 | 91精品久久久久久久久中文字幕 | 国产欧美日韩精品一区 | 成人免费视频网址 | 国产精品久久久久久久7电影 | 午夜影院在线观看视频 | 一区在线视频 | 午夜视频在线免费观看 | 亚洲社区在线 | 国产精品久久7777777 | 天天操夜夜操免费视频 | 久久精品国产一区二区三区 | 欧美又大粗又爽又黄大片视频 | 精品一区二区三区四区外站 | 成人免费观看网站 | 亚洲欧洲成人av每日更新 | 天天干视频网 | 亚洲国产情侣自拍 | 五月婷婷激情网 | 亚洲国产一 | 日韩精品中文字幕在线 | 国产精品日日做人人爱 | 国产精品免费一区二区三区四区 | 亚洲一区三区在线观看 | 亚洲国产高清高潮精品美女 | 亚洲人在线观看视频 | 久久网一区二区 | 中文字幕爱爱视频 | 天天躁日日躁狠狠的躁天龙影院 | av不卡一区|