2017開放數據中心峰會亮點之:天蝎3.0最新進展
【天蝎3.0項目是在ODCC的組織下,由騰訊公司牽頭,18家會員單位共同組建的項目,共同探索服務器的架構演進方向,瞄準服務器部件資源的解耦與池化的架構和解決方案,用于解決和優化在海量服務器使用過程中,服務器的各部件資源(CPU、內存、磁盤、SSD、網絡IO、GPU、FPGA等)的利用率不均衡造成的浪費,以及這些部件資源各自升級換代周期不同造成的服務器硬件頻繁升級問題。】
項目研究過程中,進行了很多技術方向、關鍵技術和應用場景的嘗試,近期完成了硬盤、GPU的解耦和資源池化方案研究并落地應用。
把硬盤從服務器中解耦出來,并使用SAS互連技術再將硬盤資源池和計算資源池互連起來,通過靈活的計算與存儲的數量搭配,不僅解決了計算與存儲的利用率均衡問題,還帶來了計算和存儲的冗余優點。這種結構為不同存儲密度、不同存儲熱度的應用場景提供了靈活的選擇方案。

圖1 硬盤存儲資源池化解決方案
把GPU從服務器中解耦出來,并使用PCIe互連技術再將GPU資源池和計算資源池互連起來,通過不同的計算與GPU數量搭配,可以靈活的滿足不同AI應用下對不同的GPU密度的需求,也為更大規模的GPU密度提供了解決方案。

圖2 GPU資源池化解決方案
天蝎3.0項目在硬件資源解耦和資源池化上的探索,不僅為國內互聯網企業的應用提供了創新的解決方案,幫助國內企業優化硬件成本,節約能源,也進一步推進了整個服務器產業向更加節能、環保的方向演進。
更多天蝎3.0項目的***詳細進展,請關注2017開放數據中心峰會!