考拉海購全面云原生遷移之路
今年8月底,入駐“阿里動物園”一周年的考拉海購首次宣布戰略升級,在現有的跨境業務基礎上,將重點從以“貨”為中心變成以“人”為中心,全面發力會員電商。
外界不知道的是,對考拉海購來說,升級的不只是業務。考拉海購技術負責人謝騁超介紹,考拉已全面擁抱云原生,將大幅提升運維效率,加速業務的迭代升級。
“年初,我們就完成了考拉全部遷移至阿里云。但我們認為這還不夠,又給自己定了新的KPI,9月之前讓所有的應用擁抱云原生。”

遷移融合,與時間賽跑
20億美元收購網易考拉,在阿里的收購歷史上,既不是最大,也不是最難的。但半年完成整合、未滿一年提出戰略升級,在阿里的歷史上從未有過。
快速的整合升級首先是由技術驅動的。
“這一年多我們都在跟時間賽跑。”謝聘超說。
在遷移過程中,必須保證業務不受損、全部線上服務全程可用。但現實是,原機房距離太遠,導致每一次的網絡傳輸大概有50毫秒的延時,給不停服遷移帶來了巨大的困難。

謝聘超提到,當時想到了一個比較完美的解決方案,在機房間挖了一條光纖,并建立了考拉獨立的VPC,進行數據同步。既讓網絡流暢互通,又保證了數據安全。
困難又來了。如果慢慢切換,流量先放1%,再放5%,再放10%,對于用戶體驗來說,損傷很大。試想,如果客戶下一個單需要3秒鐘,客服電話就要被打爆了。
疫情期間,考拉海購團隊緊急進行內測。把各個環節、所有的測試鏈路分批全部進行了測試,保證了整個鏈路的完整性。“那個夜晚真的是提心吊膽。”謝聘超說,“必須保證沒有灰度,才能做切換。”
最終,考拉海購全量完成了遷移,性能沒有出現任何問題。“整個遷移過程比較穩定順滑,到了阿里云,云網絡這塊也放心多了。”
考拉海購100%全站遷移至阿里云后,穩定支撐了今年3.8女神節大促。據了解,這是考拉遷移上云后的首個大促,當天流量峰值較2019年雙12增長了72%,但相比之前成本大幅度降低。考拉海購各業務線也在當天被證明100%打通,形成閉環。
謝聘超認為,整個遷移過程中,阿里云提供了很大的幫助。阿里云EPC安全方案、數據遷移方案非常成熟。此外,阿里云整體的能力支撐也很完整,遷移數據庫、ES的成本很低,沒有出現不兼容的情況。
“阿里云提供了一個很強的功能,叫有狀態的容器。”謝聘超說,以前的遷移是容器遷過來,IP地址就丟掉了。有了有狀態的容器,可以保持IP地址不變。
此外,阿里云產品提供了便捷的界面,可自助操作。
“這些產品優勢對效率提升和成本節約的價值極其巨大。”
下一步,全面擁抱云原生
完成了第一階段的目標之后,考拉海購開始了全面的云原生之路。

云原生幫助考拉海購在運維效率上有了大幅提升。云原生產品提供了眾多API,可以基于產品的運維接口進行組合,開發出系統,整體運維變得非常靈活。
在彈性上,考拉海購主要關注兩方面,一是大促前后的彈性,二是白天高峰期和晚上低峰期的彈性。第一點比較常見,第二點借助于阿里云的彈性能力,也可以實現單日內的彈性收縮,對日常成本的節約非常有效。

在容災方面,阿里云原生產品天然多AZ容災能力,極大地加速了考拉海購同城多活能力的建設,因此考拉海購才能在短時間內很快擴展到多機房,并具備多AZ的容災能力。
其次,基于ARMS和PTS,在業務不改造的情況下(個別特殊邏輯除外),就能完成全鏈路壓測能力的接入,增量業務也可以零成本接入全鏈路壓測,解決了業務監測和問題排查層面的諸多難題。
“這就是阿里云天然的優勢,因為這些云產品經過了歷年雙十一的檢測,所要面臨的問題場景和復雜度也是業界最難的,能經得住這些場景的考驗,才歷練了阿里云產品的能力。”謝聘超說。
用一年多時間重新出發,考拉海購如今走出了一條創新路徑,成為國內首屈一指的會員電商平臺。來自考拉海購官方的數據顯示,截至2020年6月30日,考拉海購會員規模同比增長23%。會員凸顯出高客單、高活躍、高復購的特點:會員年客單價是非會員的7.3倍,月度活躍是非會員的2.4倍,年訂單數是非會員的4倍。