Chiplet設計、性能240%提升,英特爾下一代數據中心CPU設計來了
下一代英特爾芯片,要有巨大的性能提升。
每年一度的 Hot Chips 是半導體業界最重要的技術會議。在其中,芯片領域專家齊聚一堂,全球芯片廠商也經常選擇在這里發布新產品,或是闡述未來的發展方向。
當地時間周一,在斯坦福大學舉辦的 Hot Chips 2023 上,英特爾首次披露了新一代數據中心芯片「Sierra Forest」,它的每瓦性能較前代提升了 240%,并有望于明年推出。
同時,英特爾首次將旗下數據中心芯片分為兩類:一類是 Granite Rapids,專注于高能耗高性能;一類是 Sierra Forest,專注于高能效。
接下來看 Granite Rapids 和 Sierra Forest 這兩款數據中心芯片的具體細節。
整體來講,得益于引入了面積高效的 E 核(能效核),Granite Rapids 和 Sierra Forest 將有望成為迄今為止英特爾 Xeon(至強 )可擴展硬件生態系統中最重要的更新之一。
先來看 Sierra Forest,它是英特爾首款用于數據中心的 E 核 Xeon 可擴展芯片,還是基于 EUV 的 Intel 3 工藝的主導產品。英特爾表示,Sierra Forest 有望于明年上半年上市。同時,Granite Rapids 也采用相同的 Intel 3 工藝。
在設計上,Granite 和 Sierra 都是基于小芯片(chiplet)的設計,依賴通過英特爾 EMIB(Embedded Multi-Die Interconnect Bridge, 嵌入式多核心互聯橋接)技術封裝在一起的計算和 I/O 小芯片的混合。不僅如此,這次的小芯片設計還有獨到之處,使用不同的計算 / IO 小芯片,而不是將「完整的」Xeon 小芯片封裝在一起。
這意味著,Granite 和 Sierra 可以共享基于 Intel 7 工藝構建的、通用 I/O 小芯片。
除了共享平臺的詳細信息外,英特爾還首次提供了 E 核和 P 核(性能核)所用架構的高級概述。正如現在多代 Xeon 的情況一樣,英特爾正在利用與其消費部件相同的基本 CPU 架構。
因此,Granite 和 Sierra 可以被認為是解構的 Meteor Lake 處理器,Granite 配備 Redwood Cove P 核心,而 Sierra 配備 Crestmont E 核心。
如前所述,這是英特爾首次嘗試為 Xeon 市場提供 E 核。對英特爾來說,這意味著要針對數據中心工作負載調整 E 核設計,與上一代以消費級應用為中心的 E 核心設計大有不同。
英特爾透露,Crestmont 正在提供 6-wide 指令解碼路徑以及 8-wide 隱退后端。雖然不如英特爾的 P 核心強大,但 E 核心絕不是輕量級核心,英特爾的設計決策反映了這一點。盡管如此,它的設計在芯片空間和能耗方面都比 Granite 中的 P 核心要高效得多。
Crestmont 的 L1 指令高速緩存(I 高速緩存)將為 64KB,是早期設計中 I-cache 大小的兩倍。與此同時,Crestmont E-core 系列的新成員可以將這些核心打包成 2 或 4 核集群,這與目前僅提供 4 核集群的 Gracemont 不同。最后,對于 Sierra/Crestmont,該芯片將提供與 Granite Rapids 盡可能接近的指令。這意味著有 BF16 數據類型支持,以及對各種指令集的支持,例如 AVX-IFMA 和 AVX-DOT-PROD-INT8。
同時對于 Granite Rapids,我們有 Redwood Cove P 核心。Redwood/Granite 是 Xeon 處理器的傳統核心,對于英特爾來說,變化并不像 Sierra Forest 那樣大,但這并不意味著他們沒有改進。
在微架構方面,Redwood Cove 獲得了與 Crestmont 相同的 64KB I 緩存,容量是其前身的 2 倍。但最值得注意的是,英特爾成功地進一步降低了浮點乘法的延遲,將其從 4/5 個周期減少到僅 3 個周期。像這樣的基本指令延遲改進很少見,因此我們總是期盼能夠出現。
除此之外,Redwood Cove 微架構還有分支預測和預取等特性,這是英特爾的典型優化目標。它們可以采取的任何措施來改進分支預測(并降低罕見失誤的成本),經常會在性能方面帶來相對較大的紅利。
Redwood Cove 的 AMX 矩陣引擎獲得了 FP16 支持,尤其適用于 Xeon 系列,而 FP16 的使用不如已支持的 BF16 和 INT8 那么多,但它總體上改進了 AMX 的靈活性。
對于內存加密的支持也正在得到改進。Granite Rapids 的 Redwood Cove 將支持 2048 個 256 位內存 key,而 Sapphire Rapids 則支持 128 個 key。
雖然現在談論 Granite Rapids 和 Sierra Forest 的各個 SKU 還為時過早,但英特爾已明確告訴我們,核心數量總體正在增加。Granite Rapids 芯片將提供比 Sapphire Rapids 更多的 CPU 內核(SPR XCC 為 60 個)。當然,Sierra 的 144 個內核將提供更多的 CPU 內核。
在之前的 Xeon 推遲并花費很長時間才將 E 核 Xeon 可擴展芯片推向市場之間,英特爾并沒有像以前那樣在數據中心市場占據主導地位,因此 Granite Rapids 和 Sierra Forest 將標志著一個重要的拐點,給英特爾數據中心產品的未來發展指明了道路。
我們知道,為互聯網和在線服務提供動力的數據中心承載著巨量的算力需求,同時也需要消耗大量電力。最近幾年隨著 AI 等技術的發展,科技公司正面臨提升算力、降低能耗的挑戰,這促使芯片公司專注于提升功耗效率。
目前,在數據中心芯片市場,英特爾的份額正一步步被 AMD 和 Ampere(前英特爾高管 Renee James 成立的初創公司)等競爭對手蠶食。
今年,Ampere 和 AMD 都已推出了自己的高效率云計算芯片,Arm 也在本次的 Hot Chips 2023 上提出了 Neoverse V2 平臺。競爭愈加激烈的當下,英特爾有危機感在所難免。