成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Flink 提交模式,你了解多少?

開發 架構
此篇以先以了解flink組件開始,再以簡單模式Local 和 Standlone 正式進入正題。本篇主要是以Yarn 方式下三種模式展開細講,當然還有Kubernetes方式(本篇不細說)。

[[439440]]

 前言

寫這種文章的初衷就是,在開發的過程中不知道怎么去選擇,各種模式不是太充分了解。現在花點時間去找資料研究對比了一番,所以出此篇。

此篇以先以了解flink組件開始,再以簡單模式Local 和 Standlone 正式進入正題。本篇主要是以Yarn 方式下三種模式展開細講,當然還有Kubernetes方式(本篇不細說)。

組件

在了解提交模式之前,先了解一下Flink組件與組件之間的協作關系。

資源管理器(Resource Manager)

(1)主要負責管理任務管理器TaskManager的插槽slot。

(2) 當作業管理器JM申請插槽資源時, RM會將有空閑插槽的TM分配給JM。如果 RM沒有足夠的插槽來滿足JM的請求。

(3)它還可以向資源提供平臺發起會話,以提供啟動 TM進程的容器。

作業管理器(JobManager)

(1) 控制一個應用程序執行的主進程,也就是說,每個應用程序 都會被一個不同的JM所控制執行。

(2) JM會先接收到要執行的應用程序,這個應用程序會包括:作業圖(Job Graph)、邏輯數據流圖( ogical dataflow graph)和打包了所有的類、庫和其它資源的JAR包。

(3) JM會把 Jobgraph轉換成一個物理層面的 數據流圖,這個圖被叫做 “執行圖”(Executiongraph),包含了所有可以并發執行的任務。Job Manager會向資源管理器( Resourcemanager)請求執行任務必要的資源,也就是 任務管理器(Taskmanager)上的插槽slot。一旦它獲取到了足夠的資源,就會將執行圖分發到真正運行它們的TM上。而在運行過程中JM會負責所有需要中央協調的操作,比如說檢查點(checkpoints)的協調。

任務管理器(Taskmanager)

(1) Flink中的工作進程。通常在 Flink中會有多個TM運行, 每個TM都包含了一定數量的插槽slots。插槽的數量限制了TM能夠執行的任務數量。

(2) 啟動之后,TM會向資源管理器注冊它的插槽;收到資源管理器的指令后, TM就會將一個或者多個插槽提供給JM調用。TM就可以向插槽分配任務tasks來執行了。

(3) 在執行過程中, 一個TM可以跟其它運行同一應用程序的TM交換數據。

分發器(Dispatcher)

(1)可以跨作業運行,它為應用提交提供了REST接口。

(2)當一個應用被提交執行時,分發器就會啟動并將應用移交給JM。

(3)Dispatcher他會啟動一個 WebUi,用來方便地 展示和監控作業執行的信息。

Local模式

JobManager 和 TaskManager 共用一個 JVM,只需要jdk支持,單節點運行,主要用來調試。

Standlone模式

Standlone 是Flink自帶的一個分布式集群,它不依賴其他的資源調度框架、不依賴yarn 等。

充當Master角色的是JobManager。

充當Slave/Worker角色是TaskManager

配置與啟動

(1)conf 目錄下有兩個文件:masters 和 workers 指定地址。

(2)需要配置 conf/flink-conf.yaml 的自行配置。

(3)分發各個機器。

(4)啟動集群 bin/start-cluster.sh

(5)提交任務 flink run

Yarn 模式

首先認識下提交流程

(1)提交App之前,先上傳Flink的Jar包和配置到HDFS,以便JobManager和TaskManager共享HDFS的數據。

(2)客戶端向ResourceManager提交Job,ResouceManager接到請求后,先分配container資源,然后通知NodeManager啟動ApplicationMaster。

(3)ApplicationMaster會加載HDFS的配置,啟動對應的JobManager,然后JobManager會分析當前的作業圖,將它轉化成執行圖(包含了所有可以并發執行的任務),從而知道當前需要的具體資源。

(4)接著,JobManager會向ResourceManager申請資源,ResouceManager接到請求后,繼續分配container資源,然后通知ApplictaionMaster啟動更多的TaskManager(先分配好container資源,再啟動TaskManager)。container在啟動TaskManager時也會從HDFS加載數據。

(5)TaskManager啟動后,會向JobManager發送心跳包。JobManager向TaskManager分配任務。

Session Mode

Session模式提前初始化好一個集群,然后向這個集群提交應用。所有應用都在同一個集群中執行,共享資源。這里JobManager僅有一個。提交到這個集群的作業可以直接運行。如圖所示

Session模式共享Dispatcher 和 ResourceManager,作業共享集群資源。

Session多個作業之間又不是隔離的,如果有一個TaskManager掛掉,它上面承載著的所有作業也會失敗。同樣來說,啟動的Job任務越多,JobManager的負載也就越大。

所以,Session模式適合生命周期短資源消耗低的場景。

提交

  1. ./bin/flink run -t yarn-session \ 
  2.   -Dyarn.application.id=application_XXXX_YY \ 
  3.   ./examples/streaming/TopSpeedWindowing.jar 

Per-Job Cluster Mode

在Per-Job模式下,每個提交到YARN上的作業會有單獨的Flink集群,擁有專屬的JobManager和TaskManager。也即:一個作業一個集群,作業之間相互隔離。

以Per-Job模式提交作業的啟動延遲可能會較高,因為不需要共享集群,所以在PipelineExecutor中執行作業提交的時候,創建集群并將JobGraph以及所需要的文件等一同提交給Yarn集群,進行一系列的初始化動作,這個時候需要些時間。提交任務的時候會把本地flink的所有jar包先上傳到hdfs上相應的臨時目錄,這個也會帶來大量的網絡的開銷。

優點就是作業之間的資源完全隔離,一個作業的TaskManager失敗不會影響其他作業的運行,JobManager的負載也是分散開來的,不存在單點問題。當作業運行完成,與它關聯的集群也就被銷毀,資源被釋放。

所以,Per-Job模式一般用來部署那些長時間運行的作業。

提交

  1. /bin/flink run -t yarn-per-job --detached ./examples/streaming/TopSpeedWindowing.jar 

「其他操作」

  1. # List running job on the cluster 
  2. ./bin/flink list -t yarn-per-job -Dyarn.application.id=application_XXXX_YY 
  3. # Cancel running job 
  4. ./bin/flink cancel -t yarn-per-job -Dyarn.application.id=application_XXXX_YY <jobId> 

Application Mode

Application 模式嘗試去將per-job 模式的資源隔離性和輕量級,可擴展的應用提交進程相結合。為了實現這個目的,它會每個Job 創建一個集群,但是 應用的main()將被在JobManager 執行。

Application 模式為每個提交的應用程序創建一個集群,該集群可以看作是在特定應用程序的作業之間共享的會話集群,并在應用程序完成時終止。在這種體系結構中Application模式在不同應用之間提供了資源隔離和負載平衡保證

在JobManager 中執行main()方法,可以節省所需的CPU周期。還有個好處就是,由于每個應用程序有一個JobManager,因此可以更平均地分散網絡負載。

提交

  1. ./bin/flink run-application -t yarn-application ./examples/streaming/TopSpeedWindowing.jar 

「其他操作」

  1. # List running job on the cluster 
  2. ./bin/flink list -t yarn-application -Dyarn.application.id=application_XXXX_YY 
  3. # Cancel running job 
  4. ./bin/flink cancel -t yarn-application -Dyarn.application.id=application_XXXX_YY <jobId> 

Application mode中的多個job,實際在代碼上的表現就是能夠允許在一個Application里面調用多次execute/executeAsyc方法。但是execute方法會被阻塞,也就是只有一個job完成之后才能繼續下一個job的execute,但是可以通過executeAsync進行異步非阻塞執行。

Yarn 模式總結

模式 生命周期 資源隔離 優點 缺點 main方法
Session 關閉會話,才會停止 共用JM和TM 預先啟動,啟動作業不再啟動。資源充分共享 資源隔離比較差,TM不容易擴展 在客戶端執行
Per-job Job停止,集群停止 單個Job獨享JM和TM 充分隔離,資源根據job按需申請 job啟動慢,每個job需要啟動一個JobManager 在客戶端執行
Application 當Application全部執行完,集群才會停止 Application使用一套JM和TM Client負載低,Application之間實現資源隔離,Application內實現資源共享 對per-job模式和session模式的優化部署模式(優點) 在Cluster中

 

責任編輯:武曉燕 來源: 大數據左右手
相關推薦

2021-10-18 06:54:46

Flink背壓系統

2023-12-09 08:58:30

AndroidActivity啟動模式

2020-03-25 08:47:22

智能邊緣邊緣計算網絡

2023-10-25 08:17:06

Lite模式代理類

2023-10-29 08:35:47

AndroidAOP編程

2021-06-06 18:22:04

PprofGopher邏輯

2012-12-27 10:58:24

KVMKVM概念

2022-06-07 07:37:40

線程進程開發

2023-09-07 10:26:50

接口測試自動化測試

2022-02-08 12:06:12

云計算

2019-08-07 17:18:18

云計算云原生函數

2011-08-23 11:03:35

ATM

2025-01-16 10:41:40

2020-12-10 09:00:00

開發.NET工具

2015-11-09 10:44:37

DevOpsIT運維

2023-12-24 12:56:36

協程

2023-08-17 10:12:04

前端整潔架構

2009-11-18 13:20:07

PHP設計模式

2011-08-10 09:35:38

2021-09-07 18:34:14

混合云架構私有云云計算
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 免费成人高清在线视频 | 欧美bondage紧缚视频 | 一区亚洲 | 国内自拍真实伦在线观看 | 国产乱码精品一区二区三区中文 | 亚洲福利一区二区 | 综合久久综合久久 | 成年免费大片黄在线观看一级 | 天天玩天天操天天干 | 国产乱码精品一区二区三区五月婷 | 国产一二三区在线 | 福利社午夜影院 | 亚洲国产精品99久久久久久久久 | 色婷婷久久久亚洲一区二区三区 | 91亚洲国产精品 | 中文字幕一区二区三区精彩视频 | 免费看欧美一级片 | 青青草华人在线视频 | 日韩在线中文字幕 | 欧美视频成人 | 草樱av | 91精品国产91久久综合桃花 | av一区二区在线观看 | 黄色精品| 在线观看www | 激情91 | 日韩精品极品视频在线观看免费 | 久久久久久久亚洲精品 | 国产91亚洲精品一区二区三区 | 黄色在线观看网址 | 一区二区中文字幕 | 日韩精彩视频 | 国产一区二区三区在线看 | 国产精品无 | 99精品国自产在线 | 国产男女猛烈无遮掩视频免费网站 | 国产福利在线播放 | 91.色| 一级在线观看 | 日韩视频免费 | 亚洲视频在线免费观看 |