成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

MLPerf放榜,中國AI芯片公司再獲世界第一!大模型推理三項冠軍,性能超越H100

人工智能 新聞
MLPerf最新GPT大模型推理測試放榜了!這家國產算力公司再拿世界第一,性能最高可達1.8倍英偉達H100。

隨著ChatGPT等AIGC應用掀起大模型浪潮,算力層作為基礎設施,成為最先受益的產業。

然而,算力需求大、費用昂貴等問題,已成為企業落地大模型的普通痛點,更可能制約AI向前發展:大模型參數日益增長,而算力供給瓶頸迫在眉睫,二者形成巨大矛盾。

如何探索更好的大模型算力方案,是業界共同關注的焦點。

近日,全球權威測評MLPerf 公布最新推理測評結果,這是MLPerf首度引入GPT大模型推理測試,參與熱度再創紀錄,收到了來自英偉達、英特爾、谷歌、高通等企業提交的13500多項性能結果。

在MLPerf Inference 3.1中,墨芯人工智能(Moffet AI)S30計算卡在大模型GPT-J(60億參數)上,單卡、4卡、8卡的算力均獲得第一。

這是墨芯在MLPerf上連續第三次衛冕。

此前墨芯曾在MLPerf Inference 2.0與2.1上,連續兩屆獲得第一。

圖片

墨芯S30計算卡

墨芯的成績,為大模型算力方案帶來了可行的創新方向。

事實證明:結合AI模型與計算平臺的軟硬協同創新,能夠釋放更大的算力潛力。這也再度印證:以稀疏計算為代表的創新技術,將是大模型時代算力發展的關鍵。

墨芯參加的是MLPerf開放分區,據主辦方MLCommons介紹,該分區旨在鼓勵創新。因此參賽者可以通過軟硬協同等方式,探索對算力的提升。

在MLPerf中的GPT-J大模型上,與4nm制程的H100純硬件加速方案相比,12nm制程的墨芯S30計算卡通過「原創的雙稀疏算法+硬件協同」方式,取得了高達1.8倍的優勢。

本次測評的GPT-J模型是生成式AI模型,墨芯S30計算卡在8卡、4卡、單卡模式下,性能分別為170.59,91.57,23.28 (Sample/s),達到英偉達H100性能的1.6倍、1.8倍、1.8倍,展現出墨芯產品在AIGC類任務上的能力。

圖片

三度奪冠,大模型算力率先「交卷」,軟硬協同持續創新——墨芯的產品實力數次經過MLPerf的嚴格檢驗,也探索出大模型算力發展的新路徑。

稀疏計算——大模型「潛力股」獲得市場認可

墨芯接連的優異成績,主要得益于基于稀疏化算法的軟硬協同設計。

在大模型時代,稀疏計算的重要性不言而喻:AI模型大小與其稀疏化潛力成正比。

也就是說,當模型越大,算法上有更大稀疏的可能性,稀疏計算可加速的幅度也越高。對于一般大型語言模型,稀疏計算可帶來數十倍加速。

墨芯獨創的雙稀疏算法,結合軟硬協同設計,使墨芯Antoum?芯片成為全球首款高稀疏倍率AI芯片,支持高達32倍稀疏——這也正是墨芯在本次MLPerf中創新紀錄的關鍵。

模型越大,稀疏計算的優勢越明顯——尤其是在GPT等大模型參數動輒上百億、千億的現狀下,這使得墨芯的護城河更為穩固。

墨芯的產品實力與稀疏計算的大勢所趨,也獲得了業界的認可:墨芯商業化進程接連取得重要突破,助力企業加速AI應用。

就在近日,墨芯正式成為支持Byte MLPerf的供應商之一。

來源:Byte MLPerf網站

項目地址:https://github.com/bytedance/ByteMLPerf/blob/main/README.md

當前,墨芯AI計算平臺已能夠支持不同參數級別的大模型,包括 BLOOM, OPT, GPT-J,LLaMA,StableDiffusion等。

同時具有高吞吐、低延時、低功耗等特點,緩解算力之困,真正為企業帶來「好用」、「用得起」的大模型算力方案。

帶來根本性的算力變革,稀疏計算助力大模型發展

墨芯的稀疏計算方案不僅能夠緩解當前的算力難題,也為AI的持續發展打開新的空間。

稀疏計算減少了AI模型的計算量,這意味著能讓大模型既在參數量上躍升若干個數量級的同時,又不產生過大的計算量,大模型參數增長與算力瓶頸的矛盾有望從根本上得到解決。

同時,由于計算量的減少,大模型的高算力需求、高功耗、高費用等痛點,也一并得到解決,實現「多贏」效果。

墨芯Antoum芯片:全球首款高稀疏倍率AI芯片,支持高達32倍稀疏

連續三屆MLPerf的優異成績,不僅是對墨芯產品實力的證明,也為業界帶來新啟示:在稀疏計算等技術的助力下,大模型的發展與應用有望迎來更廣闊的施展空間,加速AIGC等應用在各行各業遍地開花。

關于MLPerf

MLPerf由圖靈獎得主大衛?帕特森(David Patterson)聯合谷歌、斯坦福、哈佛大學頂尖學術機構發起成立,是權威性最高、影響力最廣的國際AI性能基準測試,以對迅速增長的AI計算需求與性能進行及時的跟蹤測評。

責任編輯:張燕妮 來源: 新智元
相關推薦

2017-07-04 10:02:58

AMDVega專業卡

2023-11-14 08:59:25

英偉達AI

2024-08-28 13:34:13

2023-12-19 13:32:00

模型數據

2021-02-20 07:27:27

芯片 5G芯片服務器芯片

2023-11-14 13:39:57

2021-07-08 10:13:04

AI 數據人工智能

2023-08-13 07:44:18

GPU模型英偉達

2019-10-18 16:00:19

AI 數據人工智能

2024-06-26 13:15:40

2025-04-22 09:47:07

2018-10-19 13:20:07

聯想

2024-04-10 09:10:27

Gaudi 3芯片英特爾

2024-04-10 09:28:23

2024-05-11 08:30:00

AI芯片

2013-06-19 09:58:03

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲精品自在在线观看 | 一级黄色毛片子 | v亚洲 | 国产在线观 | 国产精品自拍一区 | 国产日韩欧美在线观看 | 免费一区二区三区在线视频 | 麻豆一区二区三区精品视频 | 99pao成人国产永久免费视频 | 精品三级| 午夜理伦三级理论三级在线观看 | 亚洲视频免费观看 | 国产精品不卡一区 | 国产精品精品视频一区二区三区 | 国产成人亚洲精品 | 久久一区| 日韩综合| 日韩精品一区二区三区中文在线 | www.97zyz.com| 午夜视频免费在线观看 | 秋霞a级毛片在线看 | 99re国产精品 | 一级黄a视频 | 性生生活大片免费看视频 | 免费在线观看一区二区三区 | 久久99精品久久久久久国产越南 | www操操| 国产精品久久久久久影视 | 国产一区二区在线免费播放 | 国产欧美在线 | 一区二区三区免费观看 | 亚洲精品91 | 久久精品手机视频 | 国产免费福利小视频 | 超碰男人天堂 | 欧美另类视频 | 91精品国产综合久久久久久首页 | 日本中文字幕视频 | 亚洲第一免费播放区 | 亚洲精品在 | 亚洲v日韩v综合v精品v |