滴滴崩了,簡單聊聊
大家好呀,我是樓仔。
我之前在滴滴工作過一年多,也深度參與過滴滴十一前夕的重保,對于滴滴崩了的消息,估計很多同學都看到了,這里也想和大家簡單聊聊。
圖片
回顧來看滴滴歷史上類似故障情況在 2022 年 9 月 22 日也出現過,當日滴滴官方微博致歉稱由于機房網絡故障,導致滴滴部分服務受到影響。
然而像昨天這樣大面積、長時間的故障,滴滴史上少有。
01 事件回顧
11月27日,全國多地滴滴用戶反映,滴滴出行 App “崩了”,出現不顯示定位、地圖無法加載、扣費異常、無法打車等情況。
圖片
27 日深夜,滴滴出行對此作出回應:“非常抱歉,由于系統故障,今天晚間滴滴 App 服務出現異常,經技術同學緊急修復,目前正陸續恢復中。”
圖片
28 日早上 7 點 30 分許,滴滴出行再度道歉,稱經技術團隊連夜修復,滴滴網約車等服務已恢復,用戶可下載滴滴 App 使用打車服務。
騎車等服務還在陸續修復中,所有可開鎖或未關鎖的青桔車輛均可免費騎行。
圖片
滴滴出行發文后,仍有大量用戶反映滴滴 App 還是存在問題。
02 可能原因
滴滴官方還沒有披露原因,科創版日報記者采訪業內人士,推測原因:
- 一是可能遭受外部攻擊,系統被打穿;
- 二底層系統本身存在有缺陷。
下面是訪談記錄:
圖片
個人感覺外部攻擊的概率應該不大,大概率應該是基建服務掛了。
然后很多同學說,和 “降本增效” 有關。
03 降本增效
滴滴的“減員增效”,裁減了多少人?
21 年底,滴滴員工總數 24396 人,22 年底是 20870 人,累計減少 3526 人,裁減比例是 14.4%。
相比阿里云之前裁員 7%,滴滴裁員比例的確有點大。
圖片
而且,滴滴研發人員占員工總數比重是 40%,光 2022 年一年,就裁掉 1090 研發人員。
然后也有一些其它博主經過詳細計算,預計 2023 年,滴滴研發人員減少大概 1200-1400 人。
以上數據來源:滴滴系統崩了,跟裁員 14% 有關系嗎?
對于這次的損失,據滴滴出行此前公布的 2023 年第三季度財報顯示,單季度中國出行業務總交易額為 725 億元,日均單量達到 3130 萬單。
而以此次“崩了”的故障時長計算,估計將會讓滴滴損失過千萬的訂單量和超 4 億的交易額。
04 一點看法
對于滴滴這次崩了,除了技術本身的原因,可能還是多少和降本增效有關。
這里的降本,很多同學可能只會理解為單純的裁員,其實降本,還包括服務器費用的降本,這個費用占比通常也會非常高。
我是 18 年在滴滴呆了一年,做的是滴滴搜索,在滴滴高速擴張的時候,基本不用考慮服務器費用。
我記得當時整個搜索相關的機器就有幾百臺,僅僅一套 ES 集群,就有十幾臺機器,2 套就需要二十幾臺,而且每臺的機器成本非常高。
但是在 18 年中下旬時,滴滴也開始考慮降本,首先是縮減服務器成本,當時滴滴全部用的是物理機,由于是雙機房,費用加倍。
后來經過一輪物理機縮減后,為了繼續降本,服務陸續上云(不過后來是否上云,我就不清楚了,因為當時離開了滴滴。)
雖然這次不是流量高峰將機器打掛,但是當用戶發現請求失敗時,就會一直嘗試,請求數量就會爆發性增長,再加上早高峰,流量就非常高了,縮容后的服務,沒有提前進行擴容,有的可能會扛不住。
然后是關于人員的裁減,這個影響面就很好理解了。
不過作為一個國民級的應用,崩了 12 個小時,無論什么原因,確實很不應該。
具體原因還需要等滴滴官方解答,同時作為研發,我也整過嚴重的 P0 線上事故,希望滴滴的研發小伙伴能挺過這波難關。