計算原生網絡之元宇宙SDN控制器

作者：扎波特的網線鉗 2021-12-26 00:01:44

網絡通信技術

Compute-Native對于延遲和帶寬的追求以及對于通信容量的追求，這圖寫的非常好。PCIe、CXL都因為其總線原因編址和拉遠都存在問題。

[[441966]]

元宇宙SDN控制器?

小伙伴們對昨天利用BloomFilter過濾找到密接通信對而畫出的3D拓撲圖很感興趣。

其實它是基于3D js[1]庫實現的，具體如何做渲染可以看昨天分享的zbf的代碼。

當然還有一個項目是3d-force-graph-vr[2]。

等渣有空了買個VR眼鏡應該隨手擼幾行代碼就可以實現類似于切水果的ACL動態阻斷，或者基于拖拽的Ruta的靈活路徑規劃和流量工程。

視頻

華為 Compute-Native Networking

前幾天收到一封來自華為的郵件，講了一下它們新的總線協議，突破內存墻和I/O墻，領導數據時代計算系統創新生態型格局。這是在APNet 2021上的一個主題演講[3]：

從原理上看，Compute-native networking(后文縮寫成HCNN)的提出是很不錯的。

Compute-Native對于延遲和帶寬的追求以及對于通信容量的追求，這圖寫的非常好。PCIe、CXL都因為其總線原因編址和拉遠都存在問題。而超大規模計算的需求在那，這個是大家都要去解決的。整個思路和NetDAM是類似的，但有一點不同的是，整個UB他們是采用的特殊的通信協議:

而NetDAM采用的以太網UDP。

其實很多技術，要推倒重來有各種處理方法都非常容易，但是整個行業又有誰愿意來推倒重來給你做嫁衣? NetDAM項目最早是2020年跟第四范式談合作的時候研發的，最初的想法也就是直接做PCIe Switch然后擴展成一個更好尋址的總線，后面還有一些討論直接利用IP Packet預留寄存器區域和指令的方式來實現Cache一致性和多機同步，這些都是片面的追求極致化而不顧生態的行為。

但是保持開放和持續的后向兼容才是王道，同時能夠讀懂別的架構師在各種約束下的取舍也是十分重要的。例如在HPC這樣的多機訪問場景中，具有統一地址空間的訪問是很不錯的選擇，RDMA本身的通信方式帶來了計算規模的瓶頸，HCNN采用了如下的尋址方式：

從通信層面上看，的確報文尺寸更小，但是直接尋址對于故障隔離和冗余保護都極為不利，而且整個交換路由網絡都要重新設計，并且最終和其它設備訪問還需要添加特殊的網卡不便于利舊。而NetDAM直接利用P4交換機構建MMU的方式，并且完全支持以太網，整個生態環境上會好很多，Intel、AMD、BRCM、Cisco等很多廠家都有用以太網替代RDMA的利益沖動，而RDMA本身又因為DMA導致處理器在超過200Gbps的情況下會導致大量的Cache miss，另一方面是利舊的原因，例如Fungible這類的東西要求全網更新是完全不可能的，因此構造一個任何設備都可以UDP訪問的接口又給NetDAM這個協議增加了很多平滑遷移的可能性。