成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

一次 K8s 升級(jí),竟然導(dǎo)致滴滴故障 12 小時(shí)?

云計(jì)算 運(yùn)維
對(duì)于我們研發(fā)人員,如果有機(jī)會(huì)進(jìn)入快速增長(zhǎng)的公司,那就抓住機(jī)會(huì)多掙錢,被裁員的時(shí)候平常心看待就可以了,想在一家公司干到退休太難了。同時(shí)也要看到自己給公司帶來(lái)的價(jià)值,千萬(wàn)不要認(rèn)為我們技術(shù)厲害就比那個(gè) PPT 工程師更有價(jià)值。

大家好,我是君哥。

前段時(shí)間滴滴的故障相信大家都知道了。中斷業(yè)務(wù) 12 小時(shí)定級(jí)為 P0 級(jí)故障一點(diǎn)都不冤。

圖片圖片

故障回顧

網(wǎng)上有傳言是運(yùn)維人員升級(jí) k8s 時(shí),本來(lái)計(jì)劃是從 1.12 版本升級(jí)到 1.20,但是操作失誤選錯(cuò)了版本,操作了集群降級(jí)到低版本。

從下面滴滴技術(shù)的博客中也可以看到滴滴的升級(jí)方案:

圖片圖片

滴滴為了降低升級(jí)成本,選擇了原地升級(jí)的方式。首先升級(jí) master,然后升級(jí) node。我們一起看一下 k8s 官方架構(gòu):

圖片圖片

master(官網(wǎng)圖中叫 CONTROL PLANE) 節(jié)點(diǎn)由 3 個(gè)重要的組件組成:

  • cloud-controller-manager:負(fù)責(zé)容器編排;
  • kube-api-server:為 Node 節(jié)點(diǎn)提供 api 注冊(cè)服務(wù);
  • scheduler:負(fù)責(zé)任務(wù)調(diào)度。

Node 節(jié)點(diǎn)向 kube-api-server 注冊(cè)成功后,才可以運(yùn)行 Pod。從滴滴的博客中可以看到,采用原地升級(jí)的方式,升級(jí)了 master 之后,逐步升級(jí) Node,Node 會(huì)有一個(gè)重新注冊(cè)的過(guò)程,不過(guò)既然選擇這個(gè)方案,運(yùn)維人員應(yīng)該反復(fù)演練過(guò),重新注冊(cè)耗時(shí)應(yīng)該非常短,用戶無(wú)感知。

但是 master 選錯(cuò)版本發(fā)生降級(jí)時(shí),會(huì)把 kube-api-server 污染,Node 節(jié)點(diǎn)注冊(cè) master  失敗,又不能快速回滾,這樣 Node 節(jié)點(diǎn)被集群認(rèn)為是非健康節(jié)點(diǎn),上面的 pod 被 kill 掉,服務(wù)停止。

集群隔離

圖片圖片

這次故障大家討論的話題還有一個(gè)比較熱門的就是 k8s 集群隔離,因?yàn)槎鄠€(gè)業(yè)務(wù)比如打車業(yè)務(wù)、單車業(yè)務(wù)同時(shí)掛,說(shuō)明都在一個(gè)集群上,沒有單獨(dú)建集群來(lái)做隔離,這可能也是博客中說(shuō)的“最大集群規(guī)模已經(jīng)遠(yuǎn)遠(yuǎn)超出了社區(qū)推薦的5千個(gè) node 上限”的原因。

當(dāng)然也有可能當(dāng)時(shí)野蠻生長(zhǎng)的時(shí)候,為了快速上線開展業(yè)務(wù),就多個(gè)業(yè)務(wù)建在了一個(gè)集群上,后來(lái)可能也有過(guò)拆分的想法,但發(fā)現(xiàn)業(yè)務(wù)上升空間已經(jīng)很小,現(xiàn)有集群可以維持,所以就擱置了。

拆分成多個(gè)集群好處很明顯,業(yè)務(wù)隔離,故障隔離,可靠性增加,就拿這次升級(jí)來(lái)說(shuō),先升級(jí)一個(gè)不太關(guān)鍵、業(yè)務(wù)量也比較小的集群做試點(diǎn),升級(jí)成功了再逐個(gè)升級(jí)其他集群。

但缺點(diǎn)也很明顯,運(yùn)維復(fù)雜度增加,成本增加。

升級(jí)方案

工作這些年,也參與過(guò)一些大規(guī)模的平臺(tái)重構(gòu),但原地升級(jí)真的是沒有接觸過(guò),主要原因就是架構(gòu)師們不太愿意選擇原地升級(jí)的方案。而他們主要出于下面考慮:

  • 業(yè)務(wù)系統(tǒng)原地重構(gòu)升級(jí),不像推翻重做能夠更徹底地升級(jí)改造;
  • 考慮對(duì)業(yè)務(wù)影響最小,一般是要通過(guò)灰度發(fā)布漸進(jìn)地把流量切過(guò)去;
  • 替換升級(jí)的方案,更能展現(xiàn)團(tuán)隊(duì)的產(chǎn)出。

對(duì)于滴滴這樣的大公司,相信運(yùn)維團(tuán)隊(duì)大咖如云,無(wú)論采用哪種方案,肯定都是經(jīng)過(guò)反復(fù)驗(yàn)證的,或許不要選錯(cuò)版本,原地升級(jí)也沒有問(wèn)題。

降本增效

看了微博上滴滴道歉的留言區(qū),好多人猜測(cè)這次事故的原因是降本增效,裁掉了一線高成本的運(yùn)維,保留了成本低的新人。

從數(shù)據(jù)上來(lái)看,出于降本增效的目的,滴滴這兩年確實(shí)少了很多人,但我不相信這是造成事故的直接原因。

在快速增長(zhǎng)的階段,確實(shí)需要投入大量的技術(shù)人員來(lái)建設(shè)系統(tǒng)。但國(guó)內(nèi)互聯(lián)網(wǎng)規(guī)模也基本見頂了,一個(gè)業(yè)務(wù)經(jīng)營(yíng)這么多年,不會(huì)再有爆發(fā)式地增長(zhǎng),系統(tǒng)也已經(jīng)非常穩(wěn)定。這樣的背景下,公司確實(shí)用不了這么多技術(shù)人員了,留下部分人員來(lái)維護(hù)就夠了。

所以,無(wú)論哪家公司,降本增效是業(yè)務(wù)穩(wěn)定后必定會(huì)經(jīng)歷的階段。想想滴滴這次 12 小時(shí)故障的損失,能比養(yǎng) 1000 個(gè)技術(shù)人員的成本高嗎?

對(duì)于我們研發(fā)人員,如果有機(jī)會(huì)進(jìn)入快速增長(zhǎng)的公司,那就抓住機(jī)會(huì)多掙錢,被裁員的時(shí)候平常心看待就可以了,想在一家公司干到退休太難了。同時(shí)也要看到自己給公司帶來(lái)的價(jià)值,千萬(wàn)不要認(rèn)為我們技術(shù)厲害就比那個(gè) PPT 工程師更有價(jià)值。

總結(jié)

本文根據(jù)網(wǎng)上流傳的滴滴故障的原因,分析了升級(jí)方案和降本增效。最后,又快年末了,希望大家都能維護(hù)好自己的系統(tǒng),不要發(fā)生嚴(yán)重故障影響自己的年底考核。

責(zé)任編輯:武曉燕 來(lái)源: 君哥聊技術(shù)
相關(guān)推薦

2021-08-20 11:35:04

服務(wù)運(yùn)維 故障

2025-07-03 07:00:00

運(yùn)維K8s磁盤

2020-11-02 13:44:56

CentOSK8SLinux

2021-04-23 08:35:16

k8s故障檢測(cè)

2023-04-30 00:02:40

K8Skubelet數(shù)據(jù)

2019-08-12 08:36:33

K8S網(wǎng)絡(luò)Pod

2022-09-07 09:22:36

SpringBootWeb

2023-11-30 16:37:58

2022-02-23 08:01:04

KubernetesK8sPod

2022-11-24 14:32:00

云原生K8S

2020-12-01 07:00:10

K8S集群

2020-09-23 10:40:50

Centos7k8sJava

2022-04-22 13:32:01

K8s容器引擎架構(gòu)

2023-12-05 18:16:59

LTS版本K8s

2024-06-04 08:19:34

2024-03-18 15:44:48

K8S故障運(yùn)維

2024-02-20 16:55:14

K8S云計(jì)算

2022-10-25 08:56:16

2024-06-28 10:01:04

2023-11-06 07:16:22

WasmK8s模塊
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 岛国精品 | 91久久久久久久久久久久久 | 日韩在线视频一区 | 日韩毛片免费看 | 国产在线视频一区 | 欧美大片久久久 | 久久久久久久久久久福利观看 | 特级毛片 | 在线观看视频一区二区三区 | 中文字幕在线精品 | 玖玖玖在线观看 | 美国a级毛片免费视频 | 亚洲成人国产综合 | 午夜精品久久久久99蜜 | 综合久久一区 | 亚洲成人中文字幕 | 黄色香蕉视频在线观看 | 精品亚洲一区二区三区四区五区高 | 久久久无码精品亚洲日韩按摩 | 欧美性受xxx | 精品视频久久久久久 | 亚洲在线视频 | 欧美性另类 | 国产精品成人一区二区三区 | 亚洲国产成人在线观看 | 日韩免费高清视频 | 精品九九九 | 亚洲福利在线观看 | 天堂中文字幕av | 国产99久久精品一区二区永久免费 | 成人影| 欧美大片久久久 | 久久国产欧美一区二区三区精品 | 日韩a视频 | 亚洲第一天堂无码专区 | 九九视频在线观看 | 国产精品不卡一区二区三区 | 欧美a视频| 久久在看 | 毛片网站在线观看 | 九九久久精品视频 |