最快AI計算機開動,每秒4百億億浮點運算!正拼接最大宇宙3D地圖
一個計算機探索宇宙的史詩級時刻!近日,被譽為全球最快的人工智能工作負載超級計算機——Perlmutte宣布開啟。這臺新超級計算機以擁有6144個英偉達A100張量核心圖形處理器,將負責拼接有史以來最大的可見宇宙3D地圖。并且,它有望撥開物理學天空的烏云——暗能量。
宇宙是在不斷膨脹的嗎?是的!而令宇宙不斷膨脹的「罪魁禍首」就是暗能量。
作為是宇宙中最神秘的物質,它看不見摸不著,為了捕捉它,人類在地球上建立了許多相關實驗,但都成效甚微。
但如今,一臺擁有強大AI性能的超級計算機,或許能夠助我們一臂之力。
近日,英偉達和美國國家能源研究科學計算中心(NERSC)打開了一個「開關」—— Perlmutte,該計算機被稱為世界上用于人工智能工作負載的最快的超級計算機。
這臺新的超級計算機以天體物理學家索爾-珀爾馬特(Saul Perlmutter)的名字命名,擁有6144個英偉達A100 Tensor Core GPU,將負責拼接有史以來最大的可見宇宙3D地圖
不僅如此,Perlmutter 還將對「宇宙攝像機」暗能量光譜儀(DESI)的數據進行處理,這是一種可以在一次曝光中捕獲多達 5,000 個星系的宇宙相機。
處理DESI巨量數據,繪制最大的可見宇宙3D地圖
那么,宇宙的3D地圖該如何拼湊呢?
在不久前的5 月 17 日,DESI先行啟動,開始了為期五年的捕捉數據之旅。在此前的四個月試運行期間,DESI已經捕獲了 400 萬個星系的光譜,這超過了以往所有光譜調查的總和。
而Perlmutter要做的,就是對DESI的數據進行匯總處理。
根據官網的介紹, Perlmutter 的 GPU 在一個晚上捕獲數十次曝光。在之前的系統上,準備一年的數據以供發布可能需要數周或數月的時間,但 Perlmutter 將能夠在短短幾天內完成任務。
「我對我們在準備工作中在 GPU 上獲得的 20 倍加速感到非常滿意。」NERSC 的數據架構師 Rollin Thomas 說,他正在幫助研究人員為Perlmutter準備代碼。
Rollin Thomas難掩對Perlmutter性能的自信,因為Perlmutter是世界上最大的 A100 驅動系統,有超過 20 個應用程序正準備成為首批搭載 6,159 個NVIDIA A100 Tensor Core GPU 的應用程序,在NERSC正式投入使用后,Perlmutter將為 7,000 多名研究人員提供近 4 exaflops 的 AI 性能。

暗能量主要是通過 2011 年諾貝爾獎獲得者 Saul Perlmutter 的工作發現的。

在物理宇宙學中,暗能量是一種充溢空間的、增加宇宙膨脹速度的難以察覺的能量形式。暗能量假說是當今對宇宙加速膨脹的觀測結果的解釋中最為流行的一種。在宇宙標準模型中,暗能量占據宇宙68.3%的質能
作為某種作用于時空結構本身的能量,暗能量是種均勻的負壓力,會導致時空結構膨脹。1998年,高紅移超新星搜索隊觀測組發表了Ia型超新星的觀測數據,顯示宇宙在加速膨脹。隨之,1999年,超新星宇宙學計劃證實了該結果。該項工作于2011年獲得諾貝爾物理學獎。
但遺憾的是,目前我們對它的研究仍然不夠確切,DESI 的地圖為我們帶來了揭示暗能量奧秘的的新希望。
超級計算機融合 AI、HPC
毫無疑問,Perlmutter的作用將是無限的,除了拼湊宇宙的 3D 地圖,還能幫助探索綠色能源的亞原子相互作用等等。
NERSC的應用性能專家Brandon Cook說:「過去不可能對像電池界面這樣的大系統進行完全的原子模擬,但現在科學家們計劃用Perlmutter來做這件事。」
我們知道,傳統的超級計算機幾乎無法處理幾納秒內生成幾個原子模擬所需的數學運算,無法使用 Quantum Espresso 等程序。但通過將其高度精確的模擬與機器學習相結合,科學家可以在更長的時間內研究更多的原子。

這也是英偉達 A100 中 Tensor Core 發揮其獨特作用的地方。它們加速了用于模擬的雙精度浮點數學運算和深度學習所需的混合精度計算。
Perlmutter 基于包括 Slingshot 互連的 HPE Cray Shasta 平臺,這是一個具有 GPU 加速節點和僅 CPU 節點的異構系統。該系統分兩個階段進行安裝——最近揭幕的是第一階段,其中包括系統的 GPU 加速節點和暫存文件系統;第 2 階段將在 2021 年晚些時候添加僅使用 CPU 的節點。
英偉達高級產品營銷經理 Dion Harris 在今天發布的博客中表示:「這使 Perlmutter 成為地球上在 16 位和 32 位混合精度數學 AI 使用中速度最快的系統。而且是目前為止,今年晚些時候在勞倫斯伯克利國家實驗室的系統的第二階段或許更強。」
Perlmutter 的 A100 GPU 采用 Nvidia Tensor Core 技術和直接液體冷卻。另外,它也是 NERSC 的第一臺具有全閃存暫存文件系統的超級計算機。據 NERSC 稱,35 PB 的 Lustre 文件系統將以超過 5 TB/秒的速度移動數據,使其成為同類中最快的存儲系統。
Perlmutter 安裝的第一階段由 12 個 GPU 加速機柜組成,可容納 1,500 多個節點。今年晚些時候的第二階段將增加 12 個 CPU 機柜,超過 3,000 個節點。Phase 1 的每個 GPU 加速節點都有四個基于 NVIDIA Ampere GPU 架構的 A100 Tensor Core GPU 以及 256GB 的內存。每個 Phase 1 節點還有一個 AMD「Milan」 CPU。第一階段系統還包括非計算節點 (NCN)、20 個用戶訪問節點(NCN-UAN – 登錄節點)和服務節點。據 NERSC 稱,一些 NCN-UAN 可用于部署容器化用戶環境,使用 Kubernetes 進行編排。
第一階段機柜沒有連接門,直接液體冷卻系統的藍色和紅色線條
Phase 2 的每個 CPU 節點都將有兩個 AMD Milan CPU,每個節點具有 512GB 的內存。Phase 2 系統還增加了 20 個登錄節點和 4 個大內存節點。

支持多種編程環境,用計算極限探索宇宙極限
除了 CCE、GNU 和 LLVM 編譯器外,Perlmutter 編程環境還將采用 NVDIA HPC SDK(軟件開發套件),以支持多種并行編程模型,例如 MPI、OpenMP、CUDA 和用于 C、C++ 和 Fortran 代碼的 OpenACC。
雖然人類用肉身探索宇宙的能力有限,但計算機沒有這個障礙。
例如去年10月份,來自夏威夷大學馬諾阿分校天文研究所的一組天文學家就在AI神經網絡的幫助下,創造了迄今為止最全面的「天文學成像目錄」,包括恒星、星系和類星體等。
該系統還測定了與星系的距離,最多只有3% 的誤差。根據夏威夷大學的說法,最終的成果是「世界上最大的恒星、星系和類星體三維成像目錄」
甚至,有來自微軟的物理學家用80頁論文證明「模擬矩陣」:宇宙是個自學成才的計算機。

進化定律的自學成才系統(a self-learning system of evolutionary laws)
根據作者的觀點,宇宙也演化出了類似深度學習框架的自發系統。
我們知道,深度學習框架就是一套積木,各個組件就是某個模型或算法的一部分,你可以自己設計積木的堆疊。
因此,我們是否可以想象,宇宙演化出法則的操作矩陣架構,其本身是從一個自動教學系統演化而來的,該系統產生于最可能的最小初始條件?
論文中,作者描述了幾個模型,這些模型均實現了「自導自演」:

有7,088個節點和7,304條邊的圖,由抽樣可能的未來構成
生活中,物理定律的得出靠的是我們的觀察,所以原始物理定律將極其簡單,但經過代代更迭,定律有了自我延續并具有學習和發展的能力。
也許,宇宙不是從大爆炸開始的,而僅僅是粒子之間的簡單相互作用。
文章圍繞受限玻爾茲曼機(restricted Boltzmann machine, RBM)討論。
受限玻爾茲曼機由Hinton等人提出,是一種生成式隨機神經網絡。這個概念非常抽象,是一種類似物理學的機器學習模型。然而,受限玻爾茲曼機是最簡單的一類深度神經網絡結構,
該架構由兩層神經元組成。一個是可見層(綠色),一個是隱藏層(藍色)。

了解宇宙未知的一面,一直是天文學家努力的方向。有了AI這個「隊友」,我們會不會加速通向探秘宇宙的星辰大海呢?