整理丨諾亞
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
語雀是螞蟻集團(tuán)旗下的在線文檔編輯與協(xié)同工具。這個(gè)不算太出名的大廠產(chǎn)品最近因突發(fā)事故而來到了聚光燈下。
10月23日,有網(wǎng)友發(fā)現(xiàn),語雀突然崩了,一時(shí)之間,在線文檔、客戶端和官網(wǎng)均無法打開。更令人詫異的是,這一故障持續(xù)了7個(gè)多小時(shí),直到23日晚上10點(diǎn)多才恢復(fù)正常。
圖片
作為大廠旗下的產(chǎn)品,語雀的故障修復(fù)耗時(shí)如此之久,不免讓人好奇其原因及后續(xù)補(bǔ)救方案。昨天晚上9點(diǎn)多,語雀團(tuán)隊(duì)發(fā)文對此次事件進(jìn)行了總體復(fù)盤。
圖片
一、故障根由:新的運(yùn)維升級(jí)工具BUG
根據(jù)官方解釋,此次故障的起因是事件當(dāng)天下午“服務(wù)語雀的數(shù)據(jù)存儲(chǔ)運(yùn)維團(tuán)隊(duì)在進(jìn)行升級(jí)操作時(shí),由于新的運(yùn)維升級(jí)工具 bug,導(dǎo)致華東地區(qū)生產(chǎn)環(huán)境存儲(chǔ)服務(wù)器被誤下線。”
在其影響下,語雀數(shù)據(jù)服務(wù)發(fā)生嚴(yán)重故障,造成大面積的服務(wù)中斷。盡管進(jìn)行了全力修復(fù),但“受限于恢復(fù)方案、數(shù)據(jù)量級(jí)等因素,整體用時(shí)較長”。
語雀團(tuán)隊(duì)表示,通過這次故障深刻認(rèn)識(shí)到,“語雀作為一款服務(wù)千萬級(jí)客戶的文檔產(chǎn)品,應(yīng)該做到更完善的技術(shù)風(fēng)險(xiǎn)保障和高可用架構(gòu)設(shè)計(jì),尤其是面向技術(shù)變更操作的‘可監(jiān)控,可灰度,可回滾’的系統(tǒng)化建設(shè)和流程審計(jì)”。
為了避免重蹈覆轍,語雀團(tuán)隊(duì)針對性地制定了如下措施:
1、升級(jí)硬件版本和機(jī)型,實(shí)現(xiàn)離線后的快速上線。該措施在本次故障修復(fù)中已完成;
2、運(yùn)維團(tuán)隊(duì)加強(qiáng)運(yùn)維工具的質(zhì)量保障與測試,杜絕此類運(yùn)維 bug 再次發(fā)生;
3、縮小運(yùn)維動(dòng)作灰度范圍,增加灰度時(shí)間,提前發(fā)現(xiàn) bug;
4、從架構(gòu)和高可用層面改進(jìn)服務(wù),為語雀增加存儲(chǔ)系統(tǒng)的異地災(zāi)備。
不過對于這一回應(yīng),也有網(wǎng)友表示不滿:“首先,語雀團(tuán)隊(duì)在似乎沒有做好商業(yè)化的準(zhǔn)備就已經(jīng)商業(yè)化了。然后,沒有售后團(tuán)隊(duì),打電話聯(lián)系不到人。再者,異地災(zāi)備之前竟然沒有,無法想象。最后,也可以看出語雀團(tuán)隊(duì)灰度的隨意性。”
二、賠償方案:針對個(gè)人用戶贈(zèng)送6個(gè)月會(huì)員服務(wù)
為了致歉并挽回用戶信任,語雀團(tuán)隊(duì)在事件復(fù)盤的同時(shí)也提供了面向兩類用戶的賠償方案。
針對語雀個(gè)人用戶,我們贈(zèng)送 6 個(gè)月的會(huì)員服務(wù)。操作流程:進(jìn)入工作臺(tái)“賬戶設(shè)置”,點(diǎn)擊左側(cè)“會(huì)員信息”,在會(huì)員信息頁面點(diǎn)擊“立即領(lǐng)取”,即可獲得贈(zèng)送服務(wù)。
針對語雀空間用戶,由于情況比較復(fù)雜,我們會(huì)單獨(dú)制定賠償方案。請空間管理員留意語雀站內(nèi)信。
三、語雀的浮沉:前端大佬主導(dǎo)立項(xiàng),經(jīng)歷兩次生死危機(jī)
與釘釘、飛書不同,語雀雖然也是一款文檔產(chǎn)品,但強(qiáng)調(diào)的是“知識(shí)管理”,采用“結(jié)構(gòu)化知識(shí)庫管理”,形式上類似書籍目錄。
也正是因?yàn)檫@一特質(zhì),語雀上每一篇文檔都必須屬于某一知識(shí)庫,以期幫助用戶建立起知識(shí)管理的意識(shí)和習(xí)慣。但這也注定了語雀的受眾面較窄,畢竟有知識(shí)管理需求的用戶還是偏小眾,即使要培養(yǎng)轉(zhuǎn)化也耗時(shí)較長。
語雀的創(chuàng)始人玉伯是業(yè)內(nèi)著名的前端技術(shù)大佬。2008年加入淘寶后,玉伯先后做出了前端領(lǐng)域很火的框架 SeaJS、KISSY,之后帶領(lǐng)團(tuán)隊(duì)通過開源做了很多技術(shù)產(chǎn)品。
2016年,在螞蟻體驗(yàn)技術(shù)部的創(chuàng)新產(chǎn)品孵化機(jī)制中,玉伯團(tuán)隊(duì)主導(dǎo)的語雀問世;2018年,語雀正式對公網(wǎng)提供服務(wù);2021年,螞蟻成立了智能協(xié)同事業(yè)部,語雀作為重點(diǎn)產(chǎn)品以獨(dú)立BU運(yùn)作;2022年,語雀正式推出移動(dòng)端版本,移動(dòng)端iOS與Android同步上線。
不過,語雀的成長路徑并非一帆風(fēng)順,反而經(jīng)歷了兩次生死局。
第一次考驗(yàn)發(fā)生在2018年,彼時(shí)文檔產(chǎn)品迎來爆發(fā)期,騰訊文檔、飛書次第登場,想要抓住風(fēng)口的阿里同樣推出了釘釘文檔,而語雀團(tuán)隊(duì)將三分之二的人輸送給了釘釘。團(tuán)隊(duì)人員驟減使語雀前途未卜。
第二次則出現(xiàn)在2020年,集團(tuán)集中火力,想要合并語雀、釘釘文檔等內(nèi)部文檔團(tuán)隊(duì),成立獨(dú)立的文檔事業(yè)部,以期形成合力。但是內(nèi)部意見未統(tǒng)一,所以作罷。
熬過兩次生死局后,語雀仍然未能踏上發(fā)展的坦途,商業(yè)化成為與日俱增的壓力。2019年,語雀就開始嘗試簡單的商業(yè)化模式。但對于小團(tuán)隊(duì)來說,商業(yè)化路徑的探索并不容易。就像前文提到的,語雀受眾目標(biāo)較分散,很難第一時(shí)間發(fā)掘,也需要花時(shí)間去轉(zhuǎn)化。此前就有媒體報(bào)道,語雀主要還是服務(wù)螞蟻和阿里內(nèi)部,商業(yè)化方面較為單一。
更致命的是,今年4月,語雀的創(chuàng)始人玉伯從螞蟻離職了。對于大廠內(nèi)部孵化的創(chuàng)新項(xiàng)目而言,創(chuàng)始人的離開必然會(huì)帶來一定動(dòng)蕩,給人員組成、資源投入帶來大小不一的影響。因此當(dāng)時(shí)就有人猜測,隨著玉伯離開,語雀可能要涼。在本次突發(fā)事件中,語雀崩了7個(gè)多小時(shí),遠(yuǎn)超人們預(yù)估的恢復(fù)時(shí)間,或許可以折射出個(gè)中問題。
此外,這次語雀的故障也不得不讓人聯(lián)想,假使飛書或者釘釘掛了,你們手頭的工作還能正常進(jìn)行嗎,你們公司還能正常運(yùn)轉(zhuǎn)嗎?
參考鏈接:
https://mp.weixin.qq.com/s/WFLLU8R4bmiqv6OGa-QMcw
https://weibo.com/6448460373?refer_flag=1001030103_
https://www.36kr.com/p/2487990260602760
https://www.leiphone.com/category/industrynews/1bzDrJ28F5Pk8nEo.html