成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Spark Streaming 妙用之實現工作流調度器

大數據 Spark
開發一個完善的工作流調度器應該并不是一件簡單的事情。但是通過Spark Streaming,我們也許能簡化這些工作。

之前有說過要設計一個工作流調度器。開發一個完善的工作流調度器應該并不是一件簡單的事情。但是通過Spark Streaming(基于Transfomer架構的理念),我們可能能簡化這些工作。我在這塊并沒有什么經驗,這只是一個存在于腦海中的東西。

下面是Azkaban的架構圖:

 

也就是說要搭建一個穩定可靠的Azkaban的工作流調度器,你可能需要

  • 兩臺 互為主備MySQL
  • 兩臺Executor Server
  • 一臺Web Server

你需要做架構設計,考慮WebServer 和 Executor Server的通訊問題

擴展性問題。Executor 能夠動態調整?

穩定性問題。畢竟24小時運行的

然而,我們其實是不需要關注這么多東西的。我們真正關注的是:

  • Web UI
  • 工作流的生成,解析,運行和存儲

其他的都是基礎設施。按照Transfomer架構的設計理念,我們應該可以找到一個Estimator ,作為我們的基礎設施,我們只要關注上面兩點即可,不需要為部署,高可用,穩定等發愁。同時我們也希望譬如WebUI等工作不是從頭開始,而是按部就班添加新功即可。所以有了Estimator,我們只要做三點:

  • 實現業務邏輯,也就是工作流的生成,解析,運行和存儲等操作。
  • 實現管理頁面邏輯
  • 指定需要的資源cpu/內存,就能Run起來這個Transformer

我搜羅了一圈,發現Spark Streaming 是能夠滿足該需求的一個Estimator。

這得益于,Spark Streaming 從某個角度而言就是個定時任務調度系統,也就是我們說的微批處理。對于工作流調度器而言,無非就是每個周期(duration)在Driver端啟動線程掃描MySQL,實現任務的分發和執行。

那如果實現一個類似Azkaban 能夠的做的事情,前面我們提到,要做三件事情,分別對應為:

1.實現業務邏輯,也就是工作流的生成,解析,運行和存儲等操作。其中生成,解析,存儲 三個環節可以放在Driver端,也可以都放在Executor 端。也就是說:Driver的設計可重可輕。重的設計可由Driver讀取MySQL 并且解析成工作流任務,然后發送給Executor 去執行。輕的設計Driver僅僅是讀取MySQL,然后就簡單將id分發給各個Executor,各個Executor 負責解析執行和反饋結果。

2.增強 Spark Streaming UI,添加管理頁面,實現Azkaban Web Server類似界面。

3.按標準的Spark Streaming 程序提交該實現到集群即可完成部署。

我們看到,我們真正做到了只關注核心業務邏輯的實現,所謂部署,安裝,運行等環節都實現了平臺化(其實Estimator完成了)。 而且實現了資源的細粒度(CPU/內存)劃分,而不再是以服務器為基本單元。

事實上,我們也可以將一個Spark Streaming當做一個crontab 任務,這樣就自然具有了一個分布式的crontab系統,并且提供更友好的管理,甚至能將任務本身融入到crontab中。

后話

Spark Streaming 不一定是最合適的Estimator,你可以自己實現一套類似的Estimator,最終形成所謂的 Azkaban On Yarn的程序。

責任編輯:Ophira 來源: 簡書
相關推薦

2009-03-03 09:13:36

工作流BPM業務流程

2025-05-14 03:20:00

AgenticAIMCP

2022-10-26 08:00:43

Activiti工作流BPM

2021-10-14 11:34:05

技術工作流引擎

2013-04-23 10:28:08

IBeamMDAAWF

2024-04-25 08:00:00

DevOps架構軟件開發

2022-07-07 08:38:15

Springflowable引擎

2012-07-23 10:36:46

工作流

2010-01-04 17:42:50

SilverLight

2023-01-04 08:02:16

工作流架構設計

2011-12-14 09:58:58

JavajBPM

2023-07-05 09:48:44

Activiti部署

2023-06-12 08:01:57

Camunda工作流引擎

2017-08-14 10:30:13

SparkSpark Strea擴容

2017-06-06 08:31:10

Spark Strea計算模型監控

2015-07-14 09:26:28

微型工作流引擎設計

2024-08-05 12:46:51

2015-06-24 10:18:26

2025-01-26 15:13:00

2013-09-29 17:13:59

PowerShell工作流
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 免费黄色在线 | 美女在线视频一区二区三区 | 男女一区二区三区 | 免费在线观看一级毛片 | 久久成人精品一区二区三区 | 精品国产一区探花在线观看 | 欧美黄在线观看 | 日日干夜夜操天天操 | 亚洲国产精品一区在线观看 | 少妇一级淫片免费播放 | 国产特黄一级 | 免费看国产精品视频 | 欧美国产日韩在线 | 特黄级国产片 | 精品久久久久久 | 亚洲1区 | 欧美乱码精品一区二区三区 | 欧美日韩中文字幕在线 | 日韩一区二区在线视频 | 91亚洲国产成人精品一区二三 | 国产成人免费视频网站高清观看视频 | 午夜精品一区二区三区在线 | 国产精品久久av | 国产区视频在线观看 | 久久精品免费 | 精品一区久久 | 成人在线免费观看视频 | 一级毛片免费 | 国产精品视频久久久 | 欧美aaaa视频| 国产精品久久久久久久久久久久 | 四虎成人精品永久免费av九九 | 午夜一区二区三区在线观看 | 亚洲精品久久久久中文字幕二区 | 久久精品亚洲精品国产欧美 | 色综合成人网 | 日韩精品一区二区三区在线播放 | 免费在线成人网 | 免费激情网站 | 精品一区二区三区电影 | 日韩不卡在线观看 |