自動化如何成為多云基礎設施監控的關鍵因素
如今,企業確保其基礎設施的平穩運行,對于維護服務和客戶滿意度至關重要。
Dynatrace UK&I公司區域副總裁Greg Adams對于自動化技術在多云基礎設施監控中可以發揮的關鍵作用進行了探討。
為了跟上數字化轉型的步伐,各行各業的企業越來越多地轉向多云架構,以獲得保持領先所需的敏捷性和可擴展性。根據IDC公司的預測,隨著這一趨勢的持續,到2025年,全球在云計算服務上的總支出將超過1.3萬億美元。
然而,隨著技術環境跨越更多云平臺,添加的每個云平臺都使將管理基礎設施的任務更加復雜。反過來,這為不堪重負的IT運營(ITOps)團隊帶來了更多的工作,從而阻止他們專注于創新。事實上,研究發現,ITOps團隊將近一半(42%)的時間花在日常工作上,其目標只是為了讓其基礎設施保持正常運轉。
這些團隊顯然需要一種更可持續的方法來管理他們的基礎設施,需要一種提高多云環境中的可觀察性和自動化人工任務的方法,這樣他們就有更多的時間專注于推動創新和為他們的組織創造價值。
多云面臨的問題
如果不能有效地管理基礎設施性能,ITOps團隊將很難提供當今客戶和用戶所需的無縫數字體驗。至關重要的是,他們在多云環境中具有清晰的端到端可觀察性。不幸的是,這種洞察力變得更加難以捉摸,隨著ITOps團隊努力跟上他們的基礎設施的發展,正在出現一些問題和盲點。
多云環境本質上是復雜的,并且難以使用許多現有的基礎設施監控方法進行管理。這背后有幾個因素:
首先,每個云平臺都有自己的原生監控工具,例如Amazon CloudWatch或Azure Monitor。因此,ITOps團隊逐漸發現自己擁有越來越多的工具,他們需要在傳統監控解決方案之上進行分層,以跟蹤跨基礎設施的活動。研究表明,平均而言,企業依靠七種不同的監控解決方案來管理他們的多云環境。這迫使ITOps團隊花費更多時間地將來自各種儀表板的見解整合在一起,以識別其數字服務中的問題,因為用戶旅程會穿越多個云平臺。
Kubernetes難題
使可觀察性更加難以捉摸的另一個因素是多云環境中的變化頻率。雖然Kubernetes等平臺使企業能夠快速擴展其多云基礎設施以滿足需求,但不斷的變化使團隊難以有效地監控和管理性能。Kubernetes環境也會產生大量數據,ITOps團隊無法通過人工篩選來了解多云基礎設施對用戶體驗的影響。
這將進一步增加復雜性,在他們努力緩解“工具蔓延”的過程中,ITOps團隊通常采用自帶設備(DIY)方法進行基礎設施的監控,使用開源可觀察性解決方案將多個工具組合在一起。這會浪費人力,并且難以維護,從而阻礙數字化轉型,因為ITOps團隊沒有多少時間專注于更具戰略性的工作。
自動化課程
為了克服這些挑戰,企業需要為ITOps團隊提供一種新的基礎設施監控方法,利用AIOps來自動化盡可能多的人工任務。隨著環境的變化,這通過不斷發現和檢測多云基礎設施來消除盲點。因此,ITOps團隊可以保持端到端的可觀察性,而無需在人工監控過程中投入時間和精力。
AIOps還有助于自動分類警報和查詢可觀察性數據,以顯示團隊為向用戶和客戶提供無縫數字體驗所需的準確見解。通過這種方法,AIOps可以讓團隊了解跨多云基礎設施的任何問題的原因,并根據業務影響確定問題的優先級。這意味著ITOps團隊可以首先解決最關鍵的問題,然后將精力集中在加速組織數字化轉型的任務上。但是,這只有在團隊可以將可觀察性數據整合到一個地方時才有可能。整合視圖創建單一事實來源,提供驅動有效自動化所需的完整場景。
更多時間進行創新
隨著企業繼續向多云環境過渡,確保基礎設施平穩運行對于創建無縫數字服務和提高客戶滿意度變得越來越重要。實施以人工智能和自動化為中心的基礎設施監控策略可減輕ITOps團隊的人工任務負擔。反過來,團隊可以專注于加速轉型,并為業務帶來更好的成果。