淺談算網融合路由調度技術
1、網力調度與算力調度矛盾
傳統業務,包括公有云、私有云、邊緣云或數據中心均基于DNS域名解析或IP尋址方式提供算力服務,簡言之,即只具備單純的網力調度,與算力調度彼此獨立。該服務方式的特點如下:
1?? 算力服務狀態和網絡可達狀態彼此分離,網絡只確保IP可達,無法確保算力服務可用性,無法確保算力服務最優質量。主要如下兩個原因:
A.網絡轉發路徑最優不等價于所提供的算力服務最優;
B.所提供算力節點最優不等價于網絡轉發路徑最優。
2?? DNS域名解析或IP尋址方式,只能將算力請求調度至唯一確定的服務節點,單邊緣計算節點通常算力有限,無法聯動多邊緣節點,難以提供精細粒度、彈性算力服務。
針對上述特點,下面做簡單示例解釋。
針對第一個問題:考慮如下圖1,路由設備及邊緣計算節點組成的網絡拓撲,用戶的計算請求數據通常遵循路由器設備的IP最短路徑進行轉發。但當計算請求數據到達路由器W,邊緣計算節點(MEC 2)負載過高甚至宕機,那么計算請求就會被邊緣計算節點丟棄,導致用戶計算請求無法得到及時響應。直至服務提供商重新發布DNS更新或IP更新,重定向至其他計算節點(MEC 1),用戶計算請求才能恢復正常。
圖1 傳統網絡和算力服務協同問題示例1
即使路由器W感知到了計算節點(MEC 2)狀態異常(通常只能感知鏈路連接狀態異常,難以感知負載情況),它可能采用快速重路由技術尋址到另一條備份路徑,重定向至計算節點(MEC 1)。如圖 2 所示,從路由器 U 到路由器 W,然后再到路由器 V,但是這個臨時重定向的路徑通常不能保證 QoS質量(例如,時延、帶寬等要求),也難以為用戶提供最優的算力服務。
圖2 傳統網絡和算力服務協同問題示例2
針對第二個問題,單個邊緣節點的計算能力通常非常有限(例如,10臺服務器處理能力)。邊緣計算節點的處理能力、可靠性遠遠低于大型數據中心。通常需要跨多個邊緣節點提供算力服務,以確保更好的服務性能和可靠性。一個關鍵問題是如何將計算請求數據定向到可用于提供最優服務的技術節點。目前通用的做法是,業務提供方提供相應的計算節點域名或IP,用戶通過一定的哈希映射機制確定一個計算請求節點,向單一計算節點域名或IP發起計算請求。一旦計算節點確定,針對單用戶而言,其計算請求通常會調度至唯一確定的計算節點。采用該方式在一定程度上可以通過DNS域名更新或IP更新方式重新切換計算節點,其切換粒度較大,實時性無法確保,用戶體驗大打折扣。
綜上,現有網絡服務提供服務方式,可總結為如下兩個矛盾:
- 網力調度和算力調度彼此隔離、相互獨立的矛盾;
- 網力調度的分布式和算力調度的集中式之間的矛盾。
2、算網融合調度技術
IP網絡路由轉發均基于分布式哈希路由表DHT(Distributed Hash Table)機制工作,對圖1示例網絡及算力拓撲進行抽象,形成如下拓撲:
圖3 傳統網絡和算力服務抽象拓撲
傳統路由技術收集路由設備節點鏈路狀態信息,形成u、v、w節點形成的網絡拓撲Graph(V、E),分別由節點集合V、邊集合E組成,并據此計算生成路由信息。算力服務節點X、Y并不在其中,不參與路由計算。
進一步抽象圖3算力服務節點X、Y,將其加入路由度量,擴展至路由計算域,形成算力感知路由器,參與路由計算,形成如下網絡拓撲:
圖4 算力網絡拓撲模型
同時,可將算力路由器的計算能力(負載、處理能力、業務類型等)作為鏈路開銷度量(示例中c4、c5)加入到路由計算中。傳統上IP路由域以帶寬、時延等為代價進行路由;通過算力感知路由,可以將吞吐量、計算延遲、服務器負載等計算能力作為一種虛擬鏈路狀態來處理,并作為一種開銷度量加入路由計算中。
示例如下,形成網絡開銷、算力開銷為一體的算網網絡路由域。
圖5 算力感知網絡拓撲示例
以u為根節點,根據網絡鏈路拓撲信息,可形成如下路徑及開銷數據。網絡開銷和算力開銷共同形成最終的算力服務開銷。
圖6 算力感知計算路由表
由計算結果可知,u獲取最優算力服務的開銷為60,路徑為:u->w->v->X。如果單純基于網絡開銷計算,最優路徑為u->w->Y。由于Y節點提供的算力有限(可能是負載過高、性能限制等因素,通過算力開銷數值大小反應)。
進一步抽象,基于現有OSPF、IS-IS、BGP等傳統路由技術,引入算力開銷度量,將算力度量作為葉子信息參與算法計算,可形成通用算力感知路由框架,如圖7:
1.算力節點以算力容器(可以以實體物理設備、服務器、虛擬機、容器等為載體)形式運行,底層運行路由進程應用。
2.算力節點通過Virtual Link或物理鏈路和邊緣計算節點出口路由器相連接,通過路由協議進行本算力節點算力功能類型及算力質量開銷度量信息發布,泛洪至整個路由域。
3.全網算力節點相關算力信息通過路由協議進行全網泛洪,各設備節點收集完成鏈路拓撲信息后,進行算力路由計算,在傳統路由表基礎上,計算生成算力路由表,指導算力路由。
圖7 算力感知路由框架
傳統路由設備均基于IP路由,現網應用中基于兼容性考慮,算力服務采用IP地址或地址段方式來標識仍有必要性,典型可結合AnyCast任播技術,針對不同類型算力進行不同任播地址段劃分,使算網無縫融合,天然具備防御DDos攻擊能力,提升網絡吞吐量、弱化網絡擁塞,具備高可用性,全網可用性即算力可用性,避免單點故障。
算網融合涉及方方面面,包括算力編址、尋址、路由、生態等。不同于OverLay層面基于SRv6、APN6+等技術的算力路由技術,以上從另一維度,從傳統UnderLay路由調度維度談了對算網融合技術的粗淺認識。
3、展望
算力網絡成為運營商“主戰場”趨勢已成,家庭邊緣云、家庭業務是新型算網基礎設施落地切入關鍵點,進行算網深度融合,提供“一點接入、即取即用”的算力服務,將對家庭業務產生革命性影響。