成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Spark ON Yarn的資源分配圖解

開發 架構 Spark
在Spark中,執行內存和存儲內存共享一個統一的區域。當沒有使用執行內存時,存儲內存可以獲取所有可用內存,反之亦然。如有必要,執行內存可以占用存儲存儲,但僅限于總存儲內存使用量低于某個閾值。

[[420758]]

任務提交腳本

腳本模板

當我們提交一個Spark作業到YARN上,通常情況下會使用如下的腳本模板:

  1. spark-submit 
  2.     --class class-name 
  3.     --master yarn 
  4.     --deploy-mode cluster 
  5.     --driver-memory 4g 
  6.     --num-executors 2 
  7.     --executor-memory 2g 
  8.     --executor-cores 2 

參數解讀

具體參數的含義如下圖所示:

  • executor-cores

每個executor的最大核數

  • num-executors=每個node的executor數 * work節點的數

每個node的executor數 = 總核數 / 每個executor的最大cup核數,具體是通過參數

yarn.nodemanager.resource.cpu-vcores進行配置,比如該值配置為:33,參數executor-cores的值為:5,那么每個node的executor數 = (33 - 1[操作系統預留])/ 5 = 6,假設集群節點為10,那么num-executors = 6 * 10 =60

  • executor-memory

該參數的值依賴于:yarn-nodemanager.reaource.memory-mb,該參數限定了每個節點的container的最大內存值。

該參數的值=yarn-nodemanager.reaource.memory-mb / 每個節點的executor數量 ,如果yarn的參數配置為160,那么

yarn-nodemanager.reaource.memory-mb / 每個節點的executor數量 = 160 / 6 ≈ 26GB

Spark程序提交運行過程

  • 提交作業
  • 資源管理器分配資源啟動app master
  • App master與Driver會同步被創建
  • Spark driver與resource manager通信獲取每個節點的可用資源
  • resource manager 分配資源
  • spark driver啟動work節點上的executor
  • executor向driver發送心跳信息
  • driver發送結果到客戶端

內存管理圖解

Spark2.X的內存管理模型如下圖所示:

Spark中的內存使用大致包括兩種類型:執行和存儲。

執行內存是指用于用于shuffle、join、排序、聚合等計算的內存

存儲內存是指用于在集群中持久化和廣播內部數據的內存。

在Spark中,執行內存和存儲內存共享一個統一的區域。當沒有使用執行內存時,存儲內存可以獲取所有可用內存,反之亦然。如有必要,執行內存可以占用存儲存儲,但僅限于總存儲內存使用量低于某個閾值。

該設計確保了幾種理想的特性。首先,不使用緩存的應用程序可以使用整個空間執行,從而避免不必要的磁盤溢出。其次,使用緩存的應用程序可以保留最小存儲空間。最后,這種方法為各種工作負載提供了合理的開箱即用性能,而無需用戶內部劃分內存的專業知識。

雖然有兩種相關配置,但一般情況下不需要調整它們,因為默認值適用于大多數工作負載:

spark.memory.fraction默認大小為(JVM堆內存 - 300MB)的一小部分(默認值為0.6)。剩下的空間(40%)保留用于用戶數據結構,Spark中的內部元數據,以及在稀疏和異常大的記錄的情況下防止OOM錯誤。spark.memory.storageFraction默認大小為(JVM堆內存 - 300MB)0.60.5。

責任編輯:武曉燕 來源: 大數據技術與數倉
相關推薦

2009-09-21 16:58:00

部署VMware DR動態資源自動分配

2009-12-24 11:04:59

固定分配資源動態分配資源

2014-04-16 13:47:43

SparkYarn

2014-12-26 10:58:35

托管云托管私有云公共云

2010-04-07 15:55:17

無線接入頻段

2011-04-19 13:32:52

2011-04-19 13:48:55

vCloud Dire

2015-04-17 10:28:02

無線頻譜移動通信頻譜

2009-08-08 22:10:29

IP地址的分配局域網設置

2023-12-15 15:14:10

yarn任務管理資源管理

2018-12-18 09:00:26

Kubernetes工作負載測試

2014-08-25 09:03:44

HuluSpark On Y

2013-04-17 15:10:07

銳捷寬帶寬帶網絡

2014-04-16 11:01:07

SparkYarn

2023-05-31 08:12:26

Kubernete資源分配工具

2022-04-19 07:47:13

數據中心末端資源分配

2016-03-21 18:56:54

物聯網IoTIT基礎架構

2011-01-26 11:01:37

虛擬機負載管理資源分配

2023-10-24 07:25:10

容器資源云分級

2014-04-16 15:11:19

Spark
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美无乱码久久久免费午夜一区 | 日韩欧美视频网站 | 亚洲精品视频网站在线观看 | 一区精品国产欧美在线 | 国产精品一区一区三区 | 国产精品中文字幕一区二区三区 | 欧美国产一区二区 | 亚洲一在线| 精品亚洲一区二区三区四区五区 | 岛国一区| 亚洲精品毛片av | 99精品欧美一区二区三区综合在线 | 成人三级在线观看 | 中国美女av | 国产一级淫片a直接免费看 免费a网站 | 国产精品久久久久久久7电影 | 亚洲一区二区三区在线播放 | 91精品久久久久久久久久入口 | 国产高清久久久 | 国产一区二区影院 | 草草视频在线免费观看 | 一区二区成人 | 亚洲欧美自拍偷拍视频 | 国产精品1区2区3区 中文字幕一区二区三区四区 | 欧美在线观看一区 | 在线观看成人免费视频 | 日韩视频在线一区 | 欧美激情欧美激情在线五月 | 亚洲精品一二区 | 天天拍天天插 | 日本亚洲欧美 | 日韩精品久久 | 成人一区二区三区在线观看 | www.日本三级 | 欧美亚洲视频在线观看 | 波多野结衣精品在线 | 欧美日韩视频在线 | 亚洲黄色网址视频 | 欧产日产国产精品99 | 大伊人久久 | 91久久久久久久久 |