成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

2023-11-12阿里云故障解密和反思

運維
訪問密鑰服務(wù) (AK)在讀取白名單數(shù)據(jù)時出現(xiàn)讀取異常,因處理讀取異常的代碼存在邏輯缺陷,生成了一份不完整白名單,導(dǎo)致不在此白名單中的有效請求失敗,影響云產(chǎn)品控制臺及管控 API 服務(wù)出現(xiàn)異常,同時部分依賴 AK 服務(wù)的產(chǎn)品因不完整的白名單出現(xiàn)部分服務(wù)運行異常。

阿里云故障過去一段時間了,目前原因基本確認(rèn)了;相關(guān)原因和反思可以重新思考一下看看有哪些是值得借鑒和反思的地方。

先來看一下網(wǎng)上披露官方報告。

原因

訪問密鑰服務(wù) (AK)在讀取白名單數(shù)據(jù)時出現(xiàn)讀取異常,因處理讀取異常的代碼存在邏輯缺陷,生成了一份不完整白名單,導(dǎo)致不在此白名單中的有效請求失敗,影響云產(chǎn)品控制臺及管控 API 服務(wù)出現(xiàn)異常,同時部分依賴 AK 服務(wù)的產(chǎn)品因不完整的白名單出現(xiàn)部分服務(wù)運行異常。

改進措施

  • 增加 AK 服務(wù)白名單生成結(jié)果的校驗及告警攔截能力。
  • 增加 AK 服務(wù)白名單更新的灰度驗證邏輯,提前發(fā)現(xiàn)異常。
  • 增加 AK 服務(wù)白名單的快速恢復(fù)能力。
  • 加強云產(chǎn)品側(cè)的聯(lián)動恢復(fù)能力。

問題回顧

2023 年 11 月 12 日 17:39 起,阿里云云產(chǎn)品控制臺訪問及管控 API 調(diào)用出現(xiàn)異常、部分云產(chǎn)品服務(wù)訪問異常,工程師排查故障原因與訪問密鑰服務(wù) (AK) 異常有關(guān)。工程師修訂白名單版本后,采取分批重啟 AK 服務(wù)的措施,于 18:35 開始陸續(xù)恢復(fù),19:20 絕大部分 Region 產(chǎn)品控制臺和管控 API 恢復(fù)。

處理過程

  • 17:39:阿里云云產(chǎn)品控制臺訪問及管控 API 調(diào)用出現(xiàn)異常。
  • 17:50:工程師確認(rèn)故障是 AK 服務(wù)異常導(dǎo)致,影響云產(chǎn)品控制臺、管控 API 調(diào)用異常,以及依賴 AK 服務(wù)的云產(chǎn)品服務(wù)運行異常。
  • 18:01:工程師定位到根因。
  • 18:07:開始執(zhí)行恢復(fù)措施,包括修訂白名單版本、重啟 AK 服務(wù)。
  • 18:35:杭州等 Region 開始恢復(fù)正常。
  • 19:20:絕大部分 Region 的云產(chǎn)品控制臺和管控 API 調(diào)用恢復(fù)正常。

這里的主要原因

  • 數(shù)據(jù)沒有隔離雖然服務(wù)層面做了隔離。但是數(shù)據(jù)層生成白名單之后沒有做隔離,做了全球的推全
  • 因為用戶的權(quán)限是全球的,所有在用戶層面沒有做隔離,全球推全之后造成了全球故障
  • 白名單是故障時什么導(dǎo)致的網(wǎng)上沒有披露

暴露出來的問題 

  • 隔離:所有用戶,所有地區(qū);服務(wù)做了隔離,但是數(shù)據(jù)沒有做隔離;
  • 分級:數(shù)據(jù)上線前檢查:數(shù)據(jù)直接推全,沒有做提前檢查,沒有分級也沒有做檢查必然影響所有的用戶。

最后

我們一定不要抱著吃瓜的態(tài)度去看這個問題,冷嘲熱諷,如果事件發(fā)生在我們頭上能做哪些優(yōu)化 

優(yōu)化點:

  • 隔離:數(shù)據(jù)層面一定要想辦法做隔離;
  • 分級:數(shù)據(jù)推送線上環(huán)境之前一定要做檢查和分級,比如我可以在一個小的地區(qū)和國家先推送,沒問題再推送;
  • 檢查:在上線前一定要做case回歸。

關(guān)于穩(wěn)定性的一些個人思考:

  • 我工作大概10年了一直在處理著各種各樣的故障;
  • 越是重大的故障其實越是簡單,越是簡單的事情就越難得老板的認(rèn)可;
  • 其實我覺這個也是需要老板去思考的,一味的追求高大上,很難應(yīng)對簡單的故障;
  • 簡單的事情往往又很難得到職級和薪資待遇的提升。如何取得平衡是需要思考的。
責(zé)任編輯:武曉燕 來源: SRE說
相關(guān)推薦

2023-11-13 16:09:09

2018-06-29 10:36:29

阿里云互聯(lián)網(wǎng)故障

2013-07-25 10:28:31

阿里云阿里云SLB故障

2011-10-24 21:32:08

阿里云云應(yīng)用

2023-11-12 19:31:34

阿里云語雀

2015-11-20 13:29:19

雙11阿里云異地多活

2015-03-17 19:35:49

Xen漏洞阿里云

2021-04-12 10:07:06

云計算邊緣云阿里云

2025-06-06 11:27:12

2015-08-25 10:02:48

阿里云

2010-09-08 21:14:09

2023-12-25 21:56:22

2011-04-26 09:21:55

亞馬遜

2010-11-01 13:10:33

2015-06-24 15:29:56

阿里云香港機房癱瘓

2013-08-08 10:34:50

阿里巴巴BAT

2018-01-23 10:55:07

阿里數(shù)據(jù)庫技術(shù)雙11

2013-12-09 09:56:28

2013-08-08 10:20:04

云計算災(zāi)難恢復(fù)反思
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 理论片免费在线观看 | 亚洲精品欧洲 | 亚洲视频免费在线观看 | 日韩精品网站 | 久久九九99 | 欧美日韩国产精品激情在线播放 | h片在线观看免费 | 久久噜噜噜精品国产亚洲综合 | 久久大陆 | 国产精品一区在线播放 | 九九亚洲 | 久热国产精品 | 国产在线中文字幕 | 国产日韩久久 | 亚洲国产精品99久久久久久久久 | 亚洲成人免费av | 国产精品美女久久久av超清 | 国产精品爱久久久久久久 | 美女天天操| 欧美成人不卡 | 成人免费区一区二区三区 | 欧美精品一区二区免费 | 91精品国产色综合久久不卡蜜臀 | 日韩国产中文字幕 | 人人干人人艹 | 久久精品国产a三级三级三级 | 亚州精品天堂中文字幕 | 波多野结衣一二三区 | 国产精品视频区 | av中文字幕在线播放 | 一区二区av | 中文字幕亚洲国产 | 国产精品久久久久久久午夜片 | 精品美女在线观看视频在线观看 | 亚洲精品一区二区三区在线 | 人人做人人澡人人爽欧美 | 免费久| 欧美6一10sex性hd | 中文字幕在线观看一区 | 宅男噜噜噜66一区二区 | 国产高清亚洲 |