人工智能和軟件如何推動5G數據中心轉型
我們正在見證一個巨大的計算機創新階段。快速加速的全球5G推廣與數據密集型工作負載以及生成型人工智能的突破性發展相交叉。整個計算生態系統前所未有地需要靈活性,以創新和探索新型加速、新型系統架構和新方法來應對不斷增長的數據消費需求。半導體設計成本上升和全球能源預算緊縮帶來的額外挑戰意味著我們正處于全球計算基礎設施轉型之中。
5G與人工智能的結合蘊藏著巨大的機遇。 5G技術可以提供人工智能應用收集、傳輸和處理大量數據所需的高吞吐量、低延遲和可靠的連接。 作為回報,人工智能可以幫助 5G 網絡動態分配資源、管理流量和檢測異常。 人工智能還可以利用 5G 為用戶和設備提供個性化、情境化的智能服務。 這兩項技術將共同真正改變我們的溝通、工作和生活方式。
但每個故事都有兩個方面。 5G 和人工智能給數據中心運營商和客戶帶來了重大挑戰,因為兩者都會產生大量數據,需要以靈活、及時、經濟和節能的方式存儲、處理和分析。 為了充分利用這個機會,數據中心架構師需要圍繞計算的設計、構建和部署方式尋找變革性方法。
5G 虛擬 RAN:邊緣數據中心的關鍵推動者
支持 5G 的關鍵創新之一是虛擬無線接入網絡 (vRAN)。 vRAN 是一種相對較新的部署模型,正在流行。 它將蜂窩基帶處理功能與硬件解耦,并將其作為軟件在通用服務器上運行。
這可以在部署和管理 5G 網絡時提供更大的靈活性、可擴展性和效率。 虛擬化 5G 基礎設施的規模經濟可以通過多種方式實現。 第一,結合相同的計算基礎設施來服務 5G 連接和邊緣應用程序,使連接和數據處理更接近源; 其次,軟件驅動的云原生基礎設施可實現動態資源分配、負載平衡、更快的配置和自動化網絡管理,這對運營效率產生巨大影響。 第三,借助光纖連接,vRAN 可以將多個基站匯集到一個集中式服務器池中,從而降低 5G 基礎設施的成本和復雜性。
通過使計算能力更接近最終用戶及其設備,vRAN 可以促進邊緣計算,同時減少延遲并提高性能。
但為了充分發揮其潛力,vRAN 需要計算平臺能夠支持高吞吐量、低延遲和確定性的無線電信號處理,同時保持非常高的計算效率。 它還需要高速網絡接口來處理服務器、無線電和終端設備之間的大量數據流量,這進一步強調了對變革性方法的需求。
當今的 5G 數據中心:CPU 和 DPU
傳統通用 CPU 無法處理 5G vRAN 堆棧復雜且多樣化的工作負載。 通過將所有網絡功能虛擬化為軟件,包括操作系統、網絡層、應用程序和協議,數據中心內的流量急劇增加,從而降低了 CPU 效率。 為了應對這一挑戰,CPU 需要一個補充性的專用加速設備,可以卸載 CPU 的網絡任務,以提高性能和效率。 當今 5G 數據中心最流行的加速設備之一是數據處理單元 (DPU)。
5G 基礎設施中的人工智能。(來源:Arm)
DPU 是具有嵌入式處理器或可編程邏輯的網卡,可以執行網絡功能,例如數據包處理、加密/解密、壓縮/解壓縮、負載平衡、防火墻、路由/交換和服務質量 (QoS)。 DPU可以通過接管部分網絡相關任務來幫助降低服務器的CPU利用率和功耗,從而實現根據不同場景配置和優化網絡功能的靈活性和可編程性。
異構計算為未來的工作負載增加了更多靈活性
雖然當今的 5G 數據中心已經利用 CPU 和 DPU 來支持 vRAN 和其他 5G 應用,但下一代 5G 數據中心將需要在硬件架構、軟件平臺和服務模型方面提供更大的靈活性。 例如,數據中心可能使用 GPU 來處理復雜的數學、圖形、視頻或其他大型數據集; 用于機器學習工作負載的 GPU 或 TPU; 以及用于可編程邏輯的 FPGA,以解決更多自定義工作負載。
這種類型的異構計算有助于提高融合智能邊緣數據中心的性能、效率和可擴展性,這些數據中心可以提供更接近最終用戶的RAN服務、云計算能力和人工智能應用服務。 最終,將更專業的計算移至更靠近設備和最終用戶的位置,可以改善延遲并實現 5G 所承諾的許多下一代用例。
軟銀、英偉達和 Arm 最近宣布合作,旨在為人工智能和高性能計算 (HPC) 創建世界上最先進的數據中心。 它是當前此類數據中心轉型的最佳示例之一,具有專門的處理功能。 此次合作預計將為基于 Nvidia GH200 Grace Hopper 超級芯片的生成式 AI 和 5G/6G 應用提供一個開創性的平臺,軟銀計劃在日本各地新的分布式 AI 數據中心推出該平臺。 與過去使用的數據中心相比,新數據中心的分布將更加均勻,并可處理人工智能和 5G 工作負載。 這將使他們能夠以低延遲更好地以峰值容量運行,并大幅降低總體能源成本。
為了在全球范圍內快速部署生成式人工智能應用和服務,軟銀將與英偉達合作建立數據中心,在多租戶通用服務器平臺上托管生成式人工智能和無線應用,從而降低成本,提高能效。
這種類型的創新代表了5G和人工智能的重要拐點。圍繞專門處理提供的目標性能構建的整個數據中心為運營商提供了實現vRAN潛力所需的操作效率。此外,專門的處理使運營商能夠在同一物理位置共同托管人工智能或3D視頻會議等計算密集型服務,從而更接近數據,更接近用戶。這一點至關重要,因為靈活性、低延遲和性能效率確保了計算資源的最佳使用及其所需的資本和能源成本,從而改變了整個數據中心的TCO(總擁有成本)等式。
當我們展望下一代5G數據中心時,對靈活高效的計算平臺的需求至關重要。在5G和人工智能的推動下,為了滿足對數據中心服務日益增長的需求,下一代數據中心將被定義為適應新技術和工作負載的能力,并提供企業和消費者所需的性能和效率——我們將繼續看到高效、專業的硅作為該領域創新和轉型的基礎。