AI和ML:數據中心的新前沿創新和優化
數據中心基礎設施通常難以將當前和預計的IT負載與其關鍵基礎設施保持一致,從而導致不匹配,威脅到它們滿足不斷升級的需求的能力。在此背景下,必須修改傳統的數據中心方法。
數據中心現在正在將人工智能(AI)和機器學習(ML)技術集成到其基礎架構中,以保持競爭力。通過在傳統數據中心架構中實施人工智能驅動層,企業可以創建自主數據中心,無需人工干預即可優化和執行通用數據工程任務。
使用AI推動傳統架構
近年來,數據中心內AI和ML技術的激增引人注目。人工智能正在推動各種用例的效率和性能。
Nisum執行副總裁Sajid Mohamedy表示,人工智能驅動的數據中心可以通過優化應用性能和可用性幫助組織獲得競爭優勢,這反過來又有助于提高客戶滿意度和忠誠度。將AI添加到組合中有助于優化資源分配,從而提高數據中心效率并降低成本。”
快速故障檢測和預測、根本原因分析、電力使用優化和資源容量分配優化,只是部署數據和算法驅動技術,以最大限度提高數據中心效率的幾個例子。
隨著中斷變得越來越頻繁和昂貴,將人工智能整合到數據中心對于每個數據驅動型企業來說變得越來越必要。人工智能驅動的數據中心提供了一系列好處,其中最主要的是有可能減少停機時間,并提高整體系統可靠性,最終為組織節省大量成本。
提高故障檢測和預測能力
KPMG U.S.人工智能負責人Ellen Campana表示,人工智能歷來被用于增強數據存儲優化、能源利用和可訪問性。然而,近年來,在將AI的效用擴展到故障檢測和預測方面出現了明顯的趨勢,這可以觸發自我修復機制。
“簡化自動檢測的關鍵是為AI提供一個了解硬件和軟件操作細節的窗口,包括網絡流量。如果某個節點內的流量變慢,AI可以檢測到該模式并觸發進程或整個節點的重啟。”
IBM Automation首席技術官Pratik Gupta認為,AI具有跨越數據中心和混合云環境的變革潛力。通過增強應用中的用戶體驗、簡化操作并使CIO和業務決策者能夠從一系列數據中收集洞察力,人工智能促進了創新和優化。
清楚地了解應用資源級別
Gupta表示,IBM預計到2030年數據中心的能源消耗將增加12%(或更多),這是由于摩爾定律的到期以及數據量、速度和能源密集型工作負載的爆炸式增長。
“簡單地說,人工智能可以減少購買、維護、管理和監控的硬件數量。”
Gupta表示,數據中心管理人員必須清楚地了解其組織的應用資源水平,以便靈活地擴展以滿足實時需求。人工智能驅動的自動化可以在此過程中發揮關鍵作用,降低資源擁塞和延遲的風險,同時確保硬件工作負載保持安全并維持性能標準。
例如,IBM的Turbonomic可以自動優化應用資源級別并根據業務需求進行擴展。
Gupta表示:“這使IT管理人員能夠擁有一個單一的儀表板來監督資源水平、實時做出決策并提高效率,因為這確保其應用不會被過度配置。”
最大限度地發揮AI驅動的數據中心的優勢
數據中心的AI和ML用例持續增長,但組織在實施之前必須考慮一些關鍵因素。雖然預打包的AI和ML解決方案越來越多,但仍然需要超越單個點解決方案的集成。DIY AI部署是可能的,但需要對傳感器進行投資以收集數據和專業知識,以將數據轉化為可用的見解。
Campana表示:“許多組織選擇實施自己的數據中心,正是因為其可以確保數據不會與其他人的數據匯集在一起,或以其無法控制的方式使用。雖然這是事實,但組織必須承擔維護安全和隱私的責任。”
有了合適的資源,數據中心可以變得更智能、更高效,但實現這一目標需要優化規劃。
Gupta表示:“規劃應該是實施人工智能驅動的數據中心的關鍵支柱。成功的部署不會在一夜之間發生,在推出之前需要大量的迭代和思考。IT領導者需要考慮一些因素,例如了解可以和應該保留哪些硬件,以及需要將哪些工作負載遷移到云端。”
靈活性至關重要
人工智能驅動的數據中心成功的關鍵是采取戰略方法。這意味著確定AI和ML的正確用例,投資必要的基礎設施和工具,并培養熟練的員工團隊,以有效地管理和維護系統。
Gupta表示,企業經常維護龐大的基礎設施,從分布式數據中心位置到各種云部署。IT領導者需要考慮是否需要為所有數據源構建一個聚合湖……或者將數據準備、ML和AI工具帶到每個位置。隨著企業轉變其IT基礎設施,不僅必須考慮交付的價值,還要考慮產生的漏洞。”
其補充道:”最好的計劃也可能會出錯。技術推廣也是如此,能夠快速調整路線的靈活組織將更加成功。“
提高IT和數據中心性能的四種新興戰略
AIOps、MLOps、DevOps和SecOps各有其獨特的優勢。當結合后,可以優化數據中心運營和更廣泛的IT性能,降低成本并實現服務改進。
AIOps自動化和擴展企業范圍內的數據中心和IT工作流程
AIOps正在成為企業在數據中心的可持續發展和碳減排工作的核心,并已被證明可以有效地識別出現性能差距的原因。該技術的核心是其能夠根據實時性能數據(因果分析)解釋和建議行動。
例如,Walmart正在使用AIOps來簡化電子商務運營。AIOps依靠ML模型和自然語言處理(NLP)的組合來發現可以提高數據中心運營的準確性、成本效益和效率的新流程工作流。零售商還使用AIOps實時檢測和解決低效和不連貫的流程,同時實現技術堆棧自動化和更廣泛的基礎設施管理。
AIOps可在電子商務平臺內實現更準確的實時異常檢測。該技術還擅長關聯來自數據中心所有可用來源的數據,以提供360度的運營視圖,并確定可以改進可用性、成本控制和性能的地方。
零售商依靠DevOps來加速應用開發
零售商依靠DevOps來保持競爭力,并縮短新應用和功能的上市時間。DevOps基于強調軟件開發人員和IT運營團隊之間協作和溝通的軟件開發方法。其在簡化新移動應用、網站功能和基于客戶體驗的增強的軟件交付和開發方面被證明是有效的。
Amazon、Target、Nordstrom、Walmart和其他領先的零售商都采用DevOps作為主要軟件開發流程。零售CIO表示,DevOps代碼庫的質量越高,數據中心運行的效率就越高,為全球客戶提供最新的應用版本。
MLOps提供了一種基于生命周期的方法
隨著零售商招募更多的數據科學家,MLOps變得與DevOps一樣重要,可以保持模型的最新性和可用性。MLOps將DevOps原則應用于ML模型和算法。領先的零售商使用MLOps來設計、測試和發布新模型,以改進客戶細分、需求預測和庫存管理。
從庫存管理和優化開始,MLOps被證明可以有效解決零售業中成本最高、最具挑戰性的問題。供應鏈的不確定性、長期的勞動力短缺和不斷攀升的通貨膨脹成本,使庫存管理成為零售商成敗的關鍵。
Macy、Walmart和其他企業正在使用MLOps來優化定價和庫存管理,幫助零售商做出降低成本的決策,并保護自己免受持有過多庫存的下行風險。
SecOps依靠AI和ML來保護每個身份和威脅面
SecOps確保數據中心和更廣泛的IT基礎設施保持安全和投訴。零信任安全假設任何用戶或設備都不可信任,并且每個身份都必須經過驗證,這是任何成功實施SecOps的基礎。目標是減少日益復雜的網絡攻擊的攻擊面和風險。
SecOps通過結合最成熟的技術來減少入侵和破壞,從而優化數據中心的安全性。采用零信任安全措施有助于零售商保護其客戶、員工和供應商的身份,而微細分可以限制任何攻擊的爆炸半徑。
人工智能和數據中心技術的未來
邊緣計算正在成為開發人工智能驅動的數據中心最有前途的技術之一。通過處理更靠近源頭的數據,邊緣計算減少了延遲,并提高了整體性能。當與人工智能結合時,該技術提供了實現實時分析和決策能力的潛力,使數據中心能夠處理未來的關鍵任務程序。
Campana表示:“向5G的轉變是這一轉型的重要一步,并且正在推動基于人工智能的軟件基礎設施的創新浪潮。對于開始新數據中心的企業來說,值得考慮其采用5G和對終端用戶硬件進行其他更新的時間表。”
而Gupta以為,數據智能自動化是繼續進入嚴格監管行業的一種方式,因為人工智能和數據中心工具將被設計成自動滿足合規要求。
“隨著人工智能和自動化進一步嵌入數據中心,它們將能夠滿足最嚴格的合規協議。”