成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

作業(yè)幫基礎架構實戰(zhàn)演繹:基于云原生的降本增效之路

原創(chuàng) 精選
云計算 云原生
為了解決GPU高算力所帶來的成本問題,作業(yè)幫進行了GPU推理容器化的改造,并通過GPU算力網絡多地域的融合,實現了動態(tài)流量調度、傳輸協(xié)議自動切換、超高壓縮率、動態(tài)容量調度和密集部署,算力和顯存使用率提升30%。

嘉賓 | 呂亞霖

編輯 | 張誠

本文整理自作業(yè)幫基礎架構研發(fā)團隊的負責人呂亞霖在WOT2024大會上的主題分享。

2024年6月21日-22日,以“智啟新紀,慧創(chuàng)萬物”為主題的“WOT全球技術創(chuàng)新大會2024·北京站”正式召開。在《云原生時代的成本優(yōu)化》專場,來自作業(yè)幫基礎架構研發(fā)團隊的負責人呂亞霖帶來了《作業(yè)幫基于云原生的降本之路》的主題分享,詳細介紹了作業(yè)幫基礎架構如何基于云原生技術,在滿足業(yè)務快速迭代和穩(wěn)定性基礎上,實現系統(tǒng)化周期性的成本降低。

以下內容,根據呂亞霖老師的演講實錄整理而來。

一、云原生降本背景和目標

在實現降本的過程中,大家普遍面臨來自于三種場景的挑戰(zhàn):

場景一:短期運動化降低了成本,一年后成本反彈反而更高了;

場景二:通過舍棄穩(wěn)定性來降低成本,遇到了大的事故,得不償失;

場景三:在大型復雜系統(tǒng)內,各個團隊降本往往聚焦自身一點,無法整體統(tǒng)籌,甚至把成本轉移給其他部門。

呂亞霖認為,通過合理的云原生架構來找到一條體系化持續(xù)的降低成本路線,這就是云原生降本的目標。

作業(yè)幫的技術現狀主要分為以下四個方面。

  • 服務模塊:數千個業(yè)務模塊,數十萬計算核心,全球多云多地域多活;
  • 多語言棧:golang、C++、python、node、java等;
  • 場景多樣:工具化服務、教育類應用、智能硬件場景、AIGC場景;
  • 團隊規(guī)模:擁有上千人的產研團隊。

呂亞霖表示,這四個方面是大多數具備相同體量公司目前的主要技術現狀,因此作業(yè)幫的云原生降本路線對大多數具有相同體量的公司有著一定的參考意義。

呂亞霖強調,云原生降本路線的關鍵點有兩點。一是要熟練掌握業(yè)務特征以及技術組件的各種特征,通過云原生架構來適配底層的基礎設施;二是基礎設施要向上反饋架構的適配性,盡量能夠滿足云原生架構,即業(yè)務、中間件和基礎設施都向云原生架構靠攏,實現雙向奔赴。

二、應用:流媒體和serverless的最佳組合

作業(yè)幫有一個比較典型的業(yè)務場景是流量的時間周期特別明顯,例如主要集中在下午3點、4點、5點這幾個小時內。開始的一瞬間,流量達到峰值,之后幾乎沒有流量。

呂亞霖表示,針對作業(yè)幫的業(yè)務特點,我們使用了Serverless的VNode節(jié)點開源方案進行了改造,在一個 Service中包括很多Node物理節(jié)點和虛擬節(jié)點,虛擬節(jié)點VNode可以看成是一個無限擴展的物理節(jié)點,這樣的方案使得在上層業(yè)務中看不到任何差異。因此,我們可以把VNode當成一個無限的擴展節(jié)點,它的Pod會橫向擴容到VNode上,當流量高峰到來時。正常的服務也能夠正常調用。

呂亞霖通過一組數據,展示了流媒體服務serverless架構成本優(yōu)勢。

假設:包年包月服務器每小時成本為C,使用serverless每小時成本為1.5C。全部使用包年包月服務器的總成本為 C * 24 = 24C,serverless成本為1.5C * 5 + 10% * C* 19 = 8.4C。

最終得出的結論是,使用serverless可降低成本:(24C – 8.4C) / 24C = 65%。

雖然serverless能夠顯著降低成本,但在技術架構的改造過程中,也會面臨如下幾個方面的挑戰(zhàn)。

1.穩(wěn)定性挑戰(zhàn)

作業(yè)幫采用了調度器和分流機制來解決這一挑戰(zhàn)。

在調度器方面,一是采用預測式擴縮容YHPA,預測業(yè)務流量高峰來臨前半個小時提前調度擴容;二是兜底擴縮機制DHPA,當預警流量進入,全量急速拉起全容量服務。

在資源保證方面,一是通過與廠商商談資源的預留,讓我們想要的資源不要快速釋放,確保一定的資源預留量。二是就近地域IDC分流,比如北京IDC需要一萬核,廠商只能提供八千核,差的兩千核容量就要分流給河北的IDC,這就需要直接在端上進行分流。當然,也可以通過直接采購云上SaaS產品,在端上進行自研和Saas產品分流。

2.觀測性挑戰(zhàn)

主要通過日志采集組件DS注入POD、追蹤組件上報collector、監(jiān)控支持Prometheus、支持與kubelet通信,獲取運行POD的信息等技術來解決這一挑戰(zhàn)。

對于網絡挑戰(zhàn),作業(yè)幫通過Serverless支持指定公網EIP進行解決。在安全挑戰(zhàn)上,作業(yè)幫通過注解的方式把安全組下放,快速啟動并通過底層sanbox復用進行解決。

三、基礎組件:服務觀測基礎組件的云原生架構改造

呂亞霖以日志服務為例,介紹了基礎服務成本之殤。

“假設每日產生1PB日志,存儲&檢索一個月的日志,需要多少成本?!?呂亞霖以一道數字題,介紹了日志服務的成本。他表示,如果使用ELK,只算ES的話,按照官方介紹測算寫入和查詢需要的算力,大概需要上百臺96C物理機器。在極端計算下只算磁盤成本,1TB磁盤需要350元/月,30PB則需要350*1000*30 = 1000萬/月。監(jiān)控、日志追蹤同理。

呂亞霖表示,大部分互聯(lián)網企業(yè),服務觀測成本占在線業(yè)務總體成本(不包含大數據)的15%,甚至更高。但是,只有在5%以下才是合理區(qū)間,因此有大量的優(yōu)化空間。

在觀測體系的改造上,作業(yè)幫采用將容器產生的日志,通過輸出到logagent傳輸給Kafka,最終通過日志的存儲和檢索、日志監(jiān)控、日志追蹤分發(fā)給大數據。大多數觀測數據來自于服務網格上報,例如每次過網格時就會把分布式追蹤的上下文報下來,但實際上網格是沒有覆蓋到底下的各種存儲、MySQL、Redis或者其他存儲,這類數據是通過解析日志上報上來的。

在檢索存儲系統(tǒng)的改造上,由于Ingester是一個訂閱Kafka系統(tǒng),它會以塊(一個塊大概幾十兆)的形式寫到本地化存儲中,并且對塊上的pod信息、日期、服務建立索引。這時,它就會自動進行冷熱沉降,例如本地有一個7T存儲盤,它將預留80%,如果超過7T容量,就自動開始往對象存儲上沉降,并把最熱的數據放在本地,歷史數據放到對象存儲中。然后,在對象存儲中把超過30天的數據歸檔到冷存儲中。當需要查詢數據時,就會對下邊所屬的集群同樣發(fā)出Query請求,并通過數據找到這個塊所在的位置,對塊進行查詢。

呂亞霖表示,這并不是一個檢索系統(tǒng),而是分布式計算系統(tǒng)。其優(yōu)勢在于按塊存儲當數據寫入時吞吐量非常高,因此我們并不需要建立索引,只需要建立一個簡單的基于塊的索引信息就可以了。另外,由于采用了歸檔沉降,將超過30天的數據進行三級歸檔后進入冷存儲,冷存儲的成本就會比較低。進行數據查詢時,采用了全量的并發(fā)查詢,只需要通過簡單的命令就能夠能夠拿到結果。

通過日志云原生改造,作業(yè)幫將1%的數據存儲在本地盤,實現了0.35元/GB/月;5%的數據經過90%的壓縮后存儲在對象存儲中,實現了0.12元/GB/月;94%的數據經過90%的壓縮后存儲在深度歸檔存儲中,實現了0.03元/GB/月,參考自騰訊云廠商目錄價。

在監(jiān)控云原生改造上,作業(yè)幫采用了Prometheus體系,通過將VictoriaMetrics替換到Prometheus內部的TSDB。除此之外,還在VictoriaMetrics之前加上了Remote-write組件,支持所有Prometheus遠程寫入,同時通過寫入一個VM標準集群和降準集群來進一步降低成本。通過改造,標準集群的高精度只會保留半年,降準可以保留到三年以上。

在分布式追蹤云原創(chuàng)改造過程中,作業(yè)幫使用CK替代ES,寫入提升了40%,CPU下降了80%,磁盤下降了50%。另外,還實現了服務網格、日志分析上報,業(yè)務無感全覆蓋全采集。

四、基礎設施多云多地域融合

在IT基礎設施中,使用GPU算力所帶來的成本非常高。呂亞霖以GPT-4為例,通過一組數據詳細介紹了GPU帶來的高算力成本。

以GPT-4當前的價格做一個簡單的估算,假設日活躍用戶達到1000萬DAU,5000token / DAU,并且不考慮其他的費用,每天產生的費用為:10M * 5000 tokens * $15 / 1M tokens = $75萬,非常昂貴。

另外,受用于大模型的GPU價格昂貴、以LLM為代表的大模型參數規(guī)模變大、業(yè)務場景下的推理算力利用率不足三個方面因素的影響,使用自有服務器的成本也比較高。

呂亞霖認為,容器化是解決高算力成本的基石。他表示,容器化能夠使資源透明地、快速地部署到各個IDC,打平計算、存儲、網絡等IaaS底層資源,實現資源的透明部署,并同時支持服務觀測、服務網格、服務注冊發(fā)現等上層服務的治理。

為了解決GPU高算力所帶來的成本問題,作業(yè)幫進行了GPU推理容器化的改造,并通過GPU算力網絡多地域的融合,實現了動態(tài)流量調度、傳輸協(xié)議自動切換、超高壓縮率、動態(tài)容量調度和密集部署,算力和顯存使用率提升30%。

演講最后,呂亞霖指出,在云原生成本優(yōu)化中,要首先發(fā)現浪費,然后再制訂合理的成本優(yōu)化方案。在成本優(yōu)化時,要堅持自上而下,先易后難的原則。此外,要從平臺系統(tǒng)化、面向應用服務的成本中心、面向基礎架構的成本中心三個方面出發(fā),要持續(xù)進行優(yōu)化,才能更好地降低成本。

嘉賓介紹

呂亞霖,2019年加入作業(yè)幫,作業(yè)幫基礎架構-架構研發(fā)團隊負責人,主導了作業(yè)幫多云云原生架構演進,負責作業(yè)幫容器化建設、服務治理體系建設、多云建設、應用框架&中間件升級適配、服務穩(wěn)定性保障。對容器化、微服務框架、服務治理、DevOps等有大量一線實踐。

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2024-02-19 14:14:02

云計算人工智能大語言模型

2023-12-05 07:31:26

云容器數字化

2023-07-28 09:48:37

2022-05-17 13:40:21

云原生混部開源

2022-06-02 14:39:11

混沌工程實驗微服務

2024-09-30 08:47:07

數據分析降本增效覆蓋用戶

2024-08-07 11:06:49

2024-03-27 12:31:54

數據分析降本增效促銷活動

2024-09-20 08:20:20

2024-04-19 14:43:16

云計算分布式

2022-07-13 14:54:52

邊緣計算人工智能機器學習

2020-03-12 10:55:34

云測Testin安卓

2024-02-20 13:29:04

網絡安全研發(fā)

2023-12-25 15:38:55

2021-09-22 11:06:50

易點云
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 狠狠干av | www国产成人免费观看视频,深夜成人网 | 成人免费视频网站在线看 | 国产高清毛片 | www.日韩系列 | 日韩一区二区三区在线 | 一a一片一级一片啪啪 | 国产精品爱久久久久久久 | 黄色av网站在线观看 | 国产精品成人一区二区三区 | 国产欧美性成人精品午夜 | 美女一区二区在线观看 | 在线成人免费视频 | 精品视频一区二区 | 国产精品久久久久久婷婷天堂 | 麻豆一区二区三区精品视频 | 大久| 艹逼网 | 国产在线视频一区二区 | 人操人免费视频 | 国产精品黄色 | 欧美极品少妇xxxxⅹ免费视频 | 亚洲成人中文字幕 | 亚洲精品在线免费 | 中文字幕在线视频一区二区三区 | 色婷婷久久久久swag精品 | 妞干网av | 欧美日韩国产精品一区 | 蜜月aⅴ免费一区二区三区 99re在线视频 | 亚洲视频中文字幕 | 超碰人人人人 | 成人妇女免费播放久久久 | 国产欧美精品区一区二区三区 | 可以免费观看的av | 欧美日韩专区 | 国产精品毛片久久久久久久 | 国产一区二区精品在线 | 国产不卡一区 | 久久国产精品视频免费看 | 亚洲国产精品99久久久久久久久 | 99爱在线视频 |