成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

摩爾線程開源 MT-MegatronLM 和 MT-TransformerEngine 兩大 AI 框架

人工智能 開源
摩爾線程官方發文宣布,已正式開源 MT-MegatronLM 與 MT-TransformerEngine 兩大 AI 框架。這兩大框架通過深度融合 FP8 混合訓練策略和高性能算子庫,在國產全功能 GPU 上實現混合并行訓練和推理,提升了訓練效率與穩定性。

3 月 17 日消息,摩爾線程官方今日發文宣布,已正式開源 MT-MegatronLM 與 MT-TransformerEngine 兩大 AI 框架。這兩大框架通過深度融合 FP8 混合訓練策略和高性能算子庫,在國產全功能 GPU 上實現混合并行訓練和推理,提升了訓練效率與穩定性。

據介紹,MT-MegatronLM 是面向全功能 GPU 的開源混合并行訓練框架,支持 dense 模型、多模態模型及 MoE(混合專家)模型的高效訓練;MT-TransformerEngine 主要用于 Transformer 模型的訓練與推理優化,通過算子融合、并行加速策略等技術,釋放摩爾線程全功能 GPU 高密度計算的潛力和 memory bound 算子效率。兩大框架的技術突破體現在硬件適配與算法創新的深度協同:

  • 混合并行訓練:支持 Dense、多模態及 MoE 模型的混合并行訓練,可靈活應對不同模型架構的復雜運算場景;
  • FP8 混合訓練策略:結合摩爾線程 GPU 原生支持的 FP8 混合精度訓練策略,能夠有效提升訓練效率;
  • 高性能算子庫:通過高性能算子庫 muDNN 與通信庫 MCCL 的深度集成,系統性優化了計算密集型任務與多卡協同的通信開銷;同時結合摩爾線程開源 Simumax 庫,可自動進行并行策略搜索,并針對不同模型和加速環境 spec 最大化并行訓練性能;
  • 異常訓練處理:框架內置的 rewind 異常恢復機制,可自動回滾至最近穩定節點繼續訓練,大幅提升大規模訓練的穩定性;
  • 完整的兼容性:兩個框架兼容 GPU 主流生態,既保障了現有生態的平滑遷移,也為開發者構建自有的 AI 技術棧提供了底層支撐。

實際應用效果如下:

  • 高效訓練:在全功能 GPU 集群上,Llama3 8B 模型的訓練任務,可以利用 FP8 在 loss 幾乎無損的情況下 MFU 達到 90% 以上;(如下圖所示)


▲ 利用摩爾線程 FP8 混合精度加速技術在 loss 無損的情況下得到 28% 的加速。

  • 復現 DeepSeek 滿血版訓練:摩爾線程已深度集成并開源對 DeepSeek 并行算法 DualPipe 的高效支持,MT-DualPipe 可以完整接入 MT-Megatron 框架和 MT-TransformerEngine 框架,成功實現 DeepSeek V3 訓練流程的完整復現,支持 MLA、MTP 及多種專家平衡策略;
  • 性能大幅優化:通過多種 Transformer 算子融合技術,顯著提升了內存帶寬利用率,有效緩解 memory bound 瓶頸,進一步釋放國產 GPU 的硬件潛力。

摩爾線程官方表示將持續優化 MT-MegatronLM 與 MT-TransformerEngine 框架,并引入系列功能,具體如下:

  • Dual Pipe / ZeroBubble 并行策略:進一步降低氣泡率,提升并行訓練效率;
  • 多種 FP8 優化策略:獨創的 FP8 優化策略,提高訓練的性能和穩定性;
  • 異步 checkpoint 策略:提高訓練過程中的容錯能力和效率;
  • 優化后的重計算策略:減少計算和顯存開銷,提高訓練速度;
  • 容錯訓練策略:獨創的容錯訓練算法,增強訓練過程中的容錯能力;
  • 集成摩爾線程 FlashMLA 和 DeepGemm 庫:進一步釋放摩爾線程 GPU 的算力和 FP8 計算能力,提升計算性能和效率。

IT之家附開源地址如下:

責任編輯:龐桂玉 來源: IT之家
相關推薦

2020-11-11 12:18:22

ATT&CK網絡攻擊安全威脅

2012-02-01 09:59:05

TitaniumPhoneGapiOS

2024-05-11 07:57:47

因果推斷知識地圖算法

2020-01-21 19:30:51

AI網絡安全技術

2017-07-25 14:45:32

GlusterFSCeph存儲

2022-06-25 13:46:33

華為昇騰

2017-09-13 15:37:53

2009-11-30 16:55:10

微軟合作Novell

2011-07-01 10:42:51

IIS解析漏洞

2011-05-07 11:07:47

惠普Pro 3005M

2024-01-05 08:46:50

ReactVue

2025-02-28 08:16:14

Spring框架注解

2020-10-15 14:11:18

安全和隱私

2010-09-10 09:42:37

borderclearCSS

2010-09-16 09:33:33

CSS displayCSS display

2023-09-06 12:11:21

ChatGPT語言模型

2010-06-28 14:15:45

開源UML建模工具

2010-05-04 14:30:45

Oracle數據

2010-07-15 14:25:06

Perl時間函數
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 春色av| 精品久久久久久久久久久久久久久久久 | 久久久久国产一区二区三区四区 | 成人动慢 | 最新日韩av | 久久精品一级 | 午夜影视大全 | 在线观看视频一区 | 国产高清免费 | 国产剧情一区二区三区 | 国产一区二区三区四区五区加勒比 | 成人精品国产一区二区4080 | 国产伦精品一区二区三区照片91 | 国产欧美精品在线 | 亚洲一在线 | 国产片侵犯亲女视频播放 | 国产精品久久久久久久久久软件 | 午夜精品在线观看 | 午夜在线 | 久久久人成影片免费观看 | 国产精品视频一区二区三区 | 成人天堂噜噜噜 | 一区二区三区不卡视频 | 精品一区二区不卡 | 玩丰满女领导对白露脸hd | 欧美一区中文字幕 | 91丨国产| 国产一级电影网 | 狠狠色综合欧美激情 | 欧美成人激情 | 亚洲国内精品 | 精品国产亚洲一区二区三区大结局 | 欧美一区二区三区日韩 | 国产激情在线观看 | 日韩在线一区二区三区 | 亚洲欧美一区二区三区1000 | 欧美精品网站 | 九九久久精品 | 精品欧美乱码久久久久久 | 国产成人福利 | 九色视频网站 |