企業在2022年應避免這六大云成本優化問題
在企業發展過程中,全球大量工程團隊會將時間和精力投入到云優化上,但研究表明大多數企業無法跟上飆升的云成本。
發生這種情況的原因有很多,如果企業不制定解決方案,這種情況還會繼續發生。原因包括低成本的可見性、棘手的云定價以及確定未來需求的問題。由于這些迫在眉睫的問題,企業會浪費云資源、時間和金錢。
在本文中,我們將介紹:
- 為什么云成本優化勢在必行?
- 2022年要解決的6個頂級云成本優化問題
1、為什么云成本優化如此具有挑戰性?
公共云的按使用付費模式給工程團隊帶來了自由,但事實證明這種自由是比較昂貴的。
研究表明,大多數企業難以應對不斷上漲的云成本。傳統的公共云支出平均超出預算 24%。這種情況仍然發生的原因有很多。
這些通常歸結為低成本可見性、復雜的云定價以及預測未來需求的問題。所有這些問題都可能會影響企業的業務支出的金額。
云提供商已經了解到這一點,他們也無法提供幫助。對于大多數企業來說,解碼云賬單可能會讓人不知所措。這可能會讓一些工程團隊望而卻步,但選擇忽略云賬單并不能真正解決問題。
2、2022年要解決的6大云成本優化問題
1)被預訂和儲蓄計劃所吸引
考慮降低云成本的第一個解決方案是為企業團隊當前使用的服務支付更少的費用。與按需定價模式相比,企業會選擇儲蓄計劃或預訂,因為它們具有較大的折扣。
預先支付可預測的云賬單確實令人感到高興。
但是,企業團隊會發現并沒有解決問題,企業只是得到了折扣而已,這里有什么問題?
下面一起了解 Pinterest 降低云成本的故事,Pinterest 已提前為 AWS 服務支付了 1.7 億美元,但仍需額外支付 2000 萬美元購買額外資源。這超過了 10%。Pinterest 可能不介意這種規模的額外成本,但創業公司可能會被這些額外的成本所摧毀。
關鍵是,Pinterest 的故事讓我們明白,預測企業在 1 到 3 年內需要多少容量是很困難的。
長期致力于單一提供商,沒有靈活性,企業的業務會被鎖定,并且企業可能需要為不斷變化的業務需求付出高昂的代價。
如何應對儲蓄計劃?
最好的解決方案是盡可能避免儲蓄計劃。盡量不要提前購買資源,同時考慮解決云支出的不同選擇,包括:
- 自動定量
- 調整大小
- 資源調度
- 裝箱
2)屈服于過度配置的陷阱
當企業選擇的資源大于運行工作負載所需的資源時,就會發生過度配置。這可以使團隊獲得一種安全心態,因為沒有團隊希望在關鍵項目的中途出現中斷。
在某些企業中,團隊習慣于擁有比“備份”所需的更多資源。盡管在性能方面這個選項對工程師來說是完美的,但它會增加云浪費,從而對企業的運營成本造成損害。
過度配置有什么問題?
最簡單的答案是,過度配置會導致云資源浪費和不必要的開支,這些開支很快就會達到頂點。
在企業的團隊中鼓勵過度配置在未來會導致糟糕的結果。如果團隊習慣于獲得比工作負載要求更大的實例,則需考慮在擴展業務時這是如何工作的。云成本將占企業業務收入的很大一部分。
把這筆錢花在一些對企業有長期幫助的實質性的事情上會更好。例如,關于品牌和營銷,以便企業可以將其業務建立一個可靠的業務來源。
如何處理過度配置?
典型的方法是花錢購買定制監控和成本管理解決方案。通過調整建議大小,企業可以幫助減少團隊對過度配置資源的依賴。但是,企業仍然需要手動實現它們。
另一種解決方案是自動化。自動調整大小可以選擇最可能滿足企業的應用程序要求的實例類型和大小,同時控制成本。
當集群需要額外的節點時,人工智能驅動的實例選擇算法會自動選擇驅動最終性能的資源。企業團隊無需花費時間和精力進行分類,因為它是自動化的。
由于過度配置嵌套在業務文化中,因此創建成本優化例程以提高性能、可靠性和降低成本至關重要。自動化可能是企業變革的第一個重要步驟。
3)受到未使用的云資源的影響
企業團隊很容易遺忘為項目創建的實例。
大多數團隊都在努力處理沒有工作但仍在繼續增加成本的未使用資源。Adobe就曾犯過此類錯誤,他們每天在 Azure 的計劃外費用高達8萬美元。這些是企業無法承受的錯誤類型。
這個問題特別適用于同時發生各種事件、缺乏資源可見性的大型企業。
在 IT 團隊的領域之外的額外成本可能占企業所有 IT 開支的40%。此外,統計數據顯示,影子云的使用量可以達到已知云使用量的10倍。
未使用的云資源有什么問題?
未使用和未管理的云資源會增加成本,導致復雜的可持續性結果。
數據中心使用大量電力和硬件,主要影響企業的碳足跡。因此,減少云浪費對于減少不必要的支出和相關的碳足跡非常重要。
4)處理需求下降和高峰的效率低下
大多數其他應用程序會隨著時間的推移在使用方面發生這些變化,但對于大多數公司來說,在性能和成本之間保持平衡仍然是一項艱巨的任務。
問題是什么?
如果企業團隊不留意,若對資源有嚴格的限制,不斷增長的流量可能會產生巨額的云費用,或者導致企業的應用程序崩潰。因此,當需求低時,總是存在多付費的風險。另一方面,當需求高時,服務質量可能會受到影響。
云成本管理解決方案可以監控企業的使用情況,并在超出允許限制時實時發送通知。這些工具可以就如何根據不斷變化的需求調整云資源提供建議。但是,手動云管理既繁瑣又耗時。
這些是企業需要了解的事情:
- 小心處理流量激增和下降——分別在所有服務中向上/向下擴展資源。
- 確保應用于一個工作負載的更改不會影響其他工作負載。
- 手動優化和管理資源組,以了解有適合企業工作負載的資源。
解決方案是什么?
這是另一個可以使用云自動化來幫助企業節省時間和資源的領域。
通過自動擴展,企業可以管理上述所有任務并控制云成本。如果利用容器編排器 Kubernetes,則可以獲得三個優勢:
- Horizontal Pod Autoscaler (HPA)添加或刪除 pod 重復項以匹配不斷變化的使用情況。它研究企業的應用程序以確定副本的數量是否應該更改。
- Vertical Pod Autoscaler (VPA)減少/增加 CPU 和內存使用請求,以幫助企業根據當前使用情況調整資源。
- Cluster Autoscaler在支持的平臺上更改集群中的節點數量。
5)拒絕使用 Spot 實例
如果將其與按需定價進行比較,云服務提供商會以大幅折扣提供其未使用的容量。在 AWS 中,Spot實例的價格是正常價格的10%。
Spot實例有什么挑戰?
當企業競標備用計算資源時,無法知道這些容量可用多長時間。Spot實例具有默認持續時間;例如,AWS提供了一個Spot實例,可以提供超過5小時的不間斷時間保證。
除此之外,服務提供商可以收回Spot實例并為企業提供僅2.5分鐘的簡短通知。
在那段時間內進行更改是不可行的。開發新虛擬機也需要更多時間,因此存在潛在停機風險。
因此,如果企業在計劃使用Spot實例之前,要了解到會發生中斷的情況。它們不是關鍵工作負載的理想選擇。
如何管理這個問題?
盡管存在上述問題,但對于可以擁有多個副本的服務來說,Spot實例是非常神奇的。大多數服務在當代架構中都是無狀態的,這很好,因為Kubernetes 就是為這種設置而構建的。
以下是使用Spot實例的整個過程:
- 確定企業的工作負載及其管理中斷的能力非常重要。
- 尋找供應商提供的實例。嘗試選擇不太受歡迎的實例并監控它們的中斷頻率。
- 設置一個最高出價以避免價格立即飆升時中斷。
- 最好按組管理Spot實例并請求多個實例以增加填充它們的機會。
企業可以手動執行這些步驟,但要使其正常工作,請為大型配置、設置和維護任務做好準備。
6)推遲云自動化
在這些情況下,自動化會有所幫助。除了上面提到的過程之外,自動化解決方案可以在Spot實例不可用時立即提供幫助。
如果企業處理過云原生技術,那么自動化可能是其業務的最佳選擇。云自動化為大型企業的 IT 團隊提供了驚人的優勢。
首先,它減少了配置虛擬機、創建集群或選擇合適資源的人工勞動。此更改可幫助企業節省時間,并允許企業的團隊處理重要任務并充分利用其云基礎架構。
此外,自動化工具提供對部署至關重要的頻繁更新。它還顯著降低了人為錯誤的幾率,降低了基礎設施成本,并改進了備份流程。
最后,自動化使企業能夠了解整個業務中難以管理的正在使用的資源。簡而言之,云自動化是科技行業的新常態。
為什么不應該延遲云自動化?
如果云自動化提供了這么多好處,為什么不是所有企業都遵循它們?
從對新解決方案的抵制到對可能花費大量實現成本的擔憂,以及對更新當前設置的需要,自動化可能是壓倒性的。
在接受自動化方面,麥肯錫的一項研究證明,員工擔心他們會被技術取代,因此需要謹慎處理這個問題。
同時,自動化帶來了各種好處。但是,在2022年推遲云自動化意味著您的企業可能會錯過:
- 為企業的工作負載選擇最佳實例類型和大小。
- 自動縮放云資源以管理需求的上升/下降。
- 擺脫未優化的資源以降低成本。
- 通過處理潛在的中斷來改進spot實例。
- 減少存儲、備份、安全等方面的不必要開支。
解決方案是什么?
處理員工與自動化的矛盾是一個老問題,過去的企業因粗心大意而遭受損失。最好提醒企業團隊,云自動化將使他們從無聊、重復的任務中解放出來,他們可以將精力用于創新。
那么,企業應該如何找到并淘汰未使用的實例?這就是企業使用自動化的用武之地。
自動化的云優化解決方案可以監控企業的云使用情況,以防止效率低下和資源緊湊。它們可以自動淘汰增加云成本的未使用實例和進程。這對所有企業來說都是一種解脫。