算力互聯(lián)互通火了,它到底意味著什么?
最近這段時間,算力互聯(lián)網(wǎng)的概念突然火了。
先是5月17日,在“2025年世界電信和信息社會日紀(jì)念活動”上,中國信通院會同中國電信、中國移動、中國聯(lián)通三大運營商聯(lián)合啟動“算力互聯(lián)網(wǎng)試驗網(wǎng)”的建設(shè),并且發(fā)布了《算力互聯(lián)網(wǎng)體系架構(gòu)1.0》,引發(fā)了全網(wǎng)關(guān)注。
不久后,5月30日,工信部印發(fā)了《算力互聯(lián)互通行動計劃》(以下簡稱《行動計劃》)。其中,也明確提到了算力互聯(lián)網(wǎng),指出要“以算力互聯(lián)互通為主線,推動構(gòu)建算力互聯(lián)網(wǎng),逐步培育形成全國統(tǒng)一算力服務(wù)大市場”。
圖片
一時間,算力互聯(lián)網(wǎng)這個概念刷屏各大媒體的頭條。人人紛紛議論:到底什么是算力互聯(lián)網(wǎng)?它和我們一直在用的傳統(tǒng)互聯(lián)網(wǎng)有什么不同?又將如何影響我們的生活?
今天這篇文章,小棗君就給大家做個深入解讀。
算力互聯(lián)網(wǎng)的誕生背景
關(guān)于算力互聯(lián)網(wǎng)的定義,小棗君覺得中國信通院副院長王志勤的解釋最容易理解——
“算力互聯(lián)網(wǎng)并不是一張新的網(wǎng)絡(luò),而是在現(xiàn)有互聯(lián)網(wǎng)基礎(chǔ)上,將分散在各地的算力資源連接在網(wǎng)上,通過標(biāo)準(zhǔn)化的算力標(biāo)識和協(xié)議接口,跨域資源互聯(lián)網(wǎng)絡(luò),實現(xiàn)全網(wǎng)異構(gòu)算力的智能感知、實時發(fā)現(xiàn)、隨需獲取。”
換言之,算力互聯(lián)網(wǎng),就是一張服務(wù)于算力流動的網(wǎng)絡(luò)。它的作用,是進一步實現(xiàn)算力的互聯(lián)互通,盤活現(xiàn)有的算力資源,提升算力的使用效率,降低使用成本,為用戶帶來更好的使用體驗。
眾所周知,在目前我們所生活的數(shù)字時代,算力已然成為了一種關(guān)鍵的戰(zhàn)略資源。無論是我們的日常生活,還是企業(yè)的運營、政府的治理,都依賴于算力的支撐。
近年來,隨著人工智能技術(shù)的全面爆發(fā),算力的需求呈現(xiàn)出指數(shù)級的增長態(tài)勢。
國內(nèi)各地建設(shè)了大量算力基礎(chǔ)設(shè)施。然而,算力資源的分布并不均衡(部分地區(qū)算力過剩,部分地區(qū)算力短缺),導(dǎo)致了算力資源的浪費,算力使用效率無法獲得提升。
提出算力互聯(lián)網(wǎng),就是為了解決這些問題。
前些年我們國家提出的東數(shù)西算戰(zhàn)略,還有運營商提出的算力網(wǎng)絡(luò),也是致力于實現(xiàn)算力互聯(lián)互通。
算力互聯(lián)網(wǎng),比東數(shù)西算和算力網(wǎng)絡(luò)的目標(biāo)更大,是要實現(xiàn)整個網(wǎng)絡(luò)全域維度的互聯(lián)互通,把全網(wǎng)分散的算力基礎(chǔ)設(shè)施(算力孤島)連接起來,形成一個“經(jīng)脈暢通”的整體。
將來,個人和政企用戶使用算力,就會像使用水和電一樣,隨時隨地,即開即用,用多少買多少。
算力互聯(lián)網(wǎng)的建設(shè)挑戰(zhàn)
算力互聯(lián)網(wǎng)是在現(xiàn)有互聯(lián)網(wǎng)基礎(chǔ)上的進一步升級。但是,因為算力業(yè)務(wù)形態(tài)和傳統(tǒng)互聯(lián)網(wǎng)業(yè)務(wù)形態(tài)有很大區(qū)別,所以,這個升級也面臨著重大挑戰(zhàn)。
我們不妨把實現(xiàn)算力互聯(lián)互通看作是一個“修路”項目。
首先,需要把路修通、修寬。
分布在各地的算力資源,要先實現(xiàn)物理上的連通。現(xiàn)在的AI智算任務(wù)涉及到海量的數(shù)據(jù),對數(shù)據(jù)傳輸帶寬有極高的要求,所以,路也必須足夠“寬敞”。
其次,是交通規(guī)則的統(tǒng)一。
制定統(tǒng)一的標(biāo)準(zhǔn)和規(guī)則,建立統(tǒng)一的算力標(biāo)識體系,是將不同主體、不同類型、不同地域的公共算力資源連接起來的前提。這是一個巨大的工作量。
第三,是確保安全。
安全是算力互聯(lián)互通的前提。如此龐大的網(wǎng)絡(luò),需要增強數(shù)據(jù)安全防護能力,解決算力資源的安全性和可靠性問題,確保用戶在使用算力時數(shù)據(jù)的安全和隱私保護。
算力互聯(lián)網(wǎng),僅實現(xiàn)算力的互聯(lián)互通是不夠的。它還涉及到一個關(guān)鍵環(huán)節(jié)——算力交易。
是的,算力既是資源,也是商品。流動為交易創(chuàng)造了條件。但是,算力交易并不像我們平時買件衣服或買個手機那么簡單。算力具有無形性、異質(zhì)性、動態(tài)性等特點,這就給算力交易帶來了很大的難度。
如何尋找買方(賣方),如何定價,如何結(jié)算,如何確保算力交易的公平性、透明性和高效性,都是算力互聯(lián)網(wǎng)建設(shè)所需要面對的問題。
建立全國統(tǒng)一的算力交易平臺,制定完善的算力交易機制(包括算力定價、算力計量、算力交付等環(huán)節(jié)),從技術(shù)和制度上共同努力,才能實現(xiàn)算力的市場化運作。
算力互聯(lián)網(wǎng)的建設(shè)方向
目前看來,算力互聯(lián)網(wǎng)采取了“先互聯(lián)、再成網(wǎng)、同步建市場”的總體思路,以“技術(shù)試驗+生態(tài)共建”為核心,穩(wěn)步開展相關(guān)研究。
《行動計劃》明確給出了算力互聯(lián)互通的建設(shè)目標(biāo):
到2026年,建立較為完備的算力互聯(lián)互通標(biāo)準(zhǔn)、標(biāo)識和規(guī)則體系。到2028年,基本實現(xiàn)全國公共算力標(biāo)準(zhǔn)化互聯(lián),逐步形成具備智能感知、實時發(fā)現(xiàn)、隨需獲取的算力互聯(lián)網(wǎng)。
《行動計劃》也詳細(xì)提出了六方面共16項重點任務(wù)。如下圖所示:
圖片
這些重點任務(wù),覆蓋了推動算力互聯(lián)互通的方方面面,包括底層技術(shù)、標(biāo)準(zhǔn)規(guī)范、互聯(lián)規(guī)則、連接場景,以及平臺、應(yīng)用和安全等。
限于篇幅,小棗君就不逐一介紹了。我們看其中幾個關(guān)鍵點。
首先,在《行動計劃》中,有一句話特別值得關(guān)注——“推動數(shù)據(jù)通信產(chǎn)業(yè)高質(zhì)量發(fā)展,支撐數(shù)據(jù)高效入算、算力無損互聯(lián)”。
這在國內(nèi)官方產(chǎn)業(yè)政策中是首次提出,充分表明數(shù)據(jù)通信產(chǎn)業(yè)將在這次算力互聯(lián)網(wǎng)建設(shè)中擔(dān)當(dāng)重要角色,并迎來前所未有的發(fā)展機遇和挑戰(zhàn)。
過去數(shù)十年,數(shù)據(jù)通信產(chǎn)業(yè)支撐了互聯(lián)網(wǎng)的蓬勃發(fā)展,也為整個社會的信息化數(shù)字化打下了堅實的基礎(chǔ)。
如今,互聯(lián)網(wǎng)進入新的發(fā)展階段,數(shù)據(jù)通信也需要引入技術(shù)創(chuàng)新和架構(gòu)革命,進一步提升連接能力,為網(wǎng)絡(luò)的迭代升級保駕護航。
《行動計劃》提到了算力互聯(lián)網(wǎng)的幾個關(guān)鍵應(yīng)用場景——入算場景、算間場景、算內(nèi)場景。我們不妨基于這些場景,看看數(shù)據(jù)通信是如何進行應(yīng)對的。
● 算內(nèi)場景
算內(nèi),是數(shù)據(jù)中心(智算集群)內(nèi)部算力節(jié)點的高速互聯(lián)。
最近這幾年,很多企業(yè)都在搞AIGC大模型訓(xùn)練。這項工作對數(shù)據(jù)中心網(wǎng)絡(luò)技術(shù)提出了極大的挑戰(zhàn)。越來越龐大的集群規(guī)模,以及爆發(fā)式增長的流量,推動數(shù)據(jù)中心內(nèi)部互聯(lián)帶寬高速增長,400GE都已經(jīng)成為入門標(biāo)配,800GE/1.6TE也開始走向現(xiàn)實。
除了網(wǎng)絡(luò)規(guī)模和吞吐能力之外,數(shù)據(jù)通信網(wǎng)絡(luò)在負(fù)載均衡、智能容錯以及單點故障可自愈等方面也進行了針對性提升。例如,通過網(wǎng)絡(luò)級負(fù)載均衡(NSLB)算法,可以對路徑規(guī)劃進行優(yōu)化,消除網(wǎng)絡(luò)性能瓶頸,增加網(wǎng)絡(luò)吞吐能力。
經(jīng)過升級演進的數(shù)據(jù)通信網(wǎng)絡(luò),滿足了算內(nèi)場景的高效互聯(lián)需求。AIGC大模型的訓(xùn)練效率得到了保障,訓(xùn)練成本也隨之下降。
● 算間場景
算間,是多個智算集群之間的網(wǎng)絡(luò)連接。
隨著大模型參數(shù)的不斷增加,訓(xùn)練集群也逐漸邁入萬卡、十萬卡時代。僅靠一個數(shù)據(jù)中心無法滿足這樣的規(guī)模,需要多個異地數(shù)據(jù)中心進行算間互聯(lián),以實現(xiàn)一個超大集群。
算間場景不僅需要“長距離+大帶寬”的傳輸能力,同時還需要實現(xiàn)零丟包。
傳統(tǒng)數(shù)據(jù)通信網(wǎng)絡(luò)是無法做到零丟包的。一旦丟包,網(wǎng)絡(luò)性能就會陡降,從而導(dǎo)致算力資源的浪費。
而新型的數(shù)據(jù)通信,通過協(xié)議和算法上的改進,可以實時感知網(wǎng)絡(luò)擁塞情況,實現(xiàn)精準(zhǔn)的流控制,真正做到零丟包。哪怕數(shù)據(jù)中心之間相隔數(shù)千公里,都可以實現(xiàn)全局協(xié)同調(diào)度和無損互聯(lián)。
這同樣保障了訓(xùn)練任務(wù)的高效進行,有利于縮短大模型訓(xùn)練周期,減少訓(xùn)練投入。
● 入算場景
入算,是端側(cè)(政企等用戶側(cè))與智算中心之間的數(shù)據(jù)連接場景。
端側(cè)每天產(chǎn)生大量的數(shù)據(jù),需要上傳到云端進行處理。這種場景會產(chǎn)生大量的大象流(一種體量巨大的網(wǎng)絡(luò)數(shù)據(jù)流),占用非常大的網(wǎng)絡(luò)帶寬。
傳統(tǒng)的負(fù)載均衡技術(shù)無法應(yīng)對這種類型的流量,容易出現(xiàn)擁塞、丟包等,拉低網(wǎng)絡(luò)效率。
新型的數(shù)據(jù)通信網(wǎng)絡(luò),可以提供10Mbps~100Gbps彈性帶寬能力,通過引入大象流精準(zhǔn)識別和流級調(diào)度技術(shù),可以實現(xiàn)入算網(wǎng)絡(luò)的負(fù)載均衡和千萬級的流調(diào)度能力。
海量樣本高效入算,成為了現(xiàn)實。用戶再也不用寄送硬盤來傳送數(shù)據(jù)了。
圖片
總而言之,我們可以看到,數(shù)據(jù)通信網(wǎng)絡(luò)一直在持續(xù)演進和創(chuàng)新,以此滿足時代發(fā)展的需求。AI浪潮的突然到來,加速推動了數(shù)據(jù)通信網(wǎng)絡(luò)的演進。算力互聯(lián)網(wǎng)的算內(nèi)、算間和入算場景,給了數(shù)據(jù)通信網(wǎng)絡(luò)更大的舞臺,讓它有機會展現(xiàn)更多的價值和能力。
在這個舞臺上,數(shù)據(jù)通信網(wǎng)絡(luò)不僅需要滿足高速、大帶寬、低延遲等基本要求,還需要具備智能化、靈活調(diào)度、安全可靠等特性,以應(yīng)對日益復(fù)雜多變的場景需求。
算力最終是要為應(yīng)用場景服務(wù)的。數(shù)據(jù)通信網(wǎng)絡(luò)構(gòu)建了算力互聯(lián)網(wǎng),打通了算力和應(yīng)用之間的阻隔,實現(xiàn)了算力向各個垂直行業(yè)領(lǐng)域的賦能。這不僅推動了全行業(yè)的數(shù)智化轉(zhuǎn)型,也加速了整個數(shù)字經(jīng)濟的重塑。
最后的話
目前,我國算力互聯(lián)網(wǎng)建設(shè)已取得初步成果。
在資源互聯(lián)調(diào)度層面,已完成131家企業(yè)499個算力資源池的資源標(biāo)識,匯聚了111.3 EFlops智能計算資源。這些資源,正在為千行百業(yè)的數(shù)智化轉(zhuǎn)型發(fā)揮重要作用。
算力互聯(lián)網(wǎng)的建設(shè)是一個復(fù)雜而龐大的系統(tǒng)工程,面臨的困難和挑戰(zhàn)仍然很多。