成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

開放創新,昇騰 CANN 再向深處

企業動態
隨著開發者的開發方式逐漸從上層軟件走向底層硬件,昇騰 CANN 的開放深度和開放策略也持續演進,構建起了覆蓋算子開發、系統調優到編譯鏈優化的全場景賦能體系。

AI 領域有自己的速度。

4月29日凌晨4點,Qwen3 正式發布,并開源全部8款混合推理模型。發布僅2小時,Qwen3 模型在 GitHub 上的 Star 數已近17k。更有趣的是,開源5小時后,華為計算發文宣布實現 Qwen3 的 0Day 適配,即在 MindSpeed 和 MindIE 中開箱即用。這意味著,開發者可以第一時間零門檻使用最新的 AI 能力。

這樣軟硬件閃電協同的背后,華為昇騰異構計算架構 CANN 的深度開放策略提供了核心支撐。

能力解耦,技術優勢的最后一公里

據IDC預測,2026年中國智能算力規模將達到1460.3 EFLOPS,為2024年的兩倍,AI 算力需求正經歷指數級增長。這一增長不僅標志著 AI 技術從實驗室走向實際應用的加速,也對異構計算架構提出了更高的要求。

然而,傳統 AI 開發在落地過程中面臨的“三座大山”正在吞噬技術革命的紅利。

一是開發效率低下。算子開發門檻高,業務需求的響應時間也動輒數周,“創新誕生即過時”成為常態。

二是性能釋放不足。當前 AI 算力資源普遍存在靜態分配僵化與動態需求錯配的矛盾,硬件能力常常因原子能力組合方式固化,導致有效性能輸出遭遇供給瓶頸。

三是生態協同缺失。隨著計算需求的多樣化,CPU、GPU、FPGA、ASIC 等不同架構計算單元被廣泛應用,但多元計算架構因技術標準割裂及調度機制缺位,通常難以實現資源最優調配,造成算力限制與效率不足。

當開發遲滯、性能折損、生態割裂鎖死產業創新,鋪向最后一公里的重點不再只是算力堆砌,而在能力解耦——這正是昇騰 CANN深度開放的戰略原點。

作為昇騰 AI 基礎軟硬件平臺的核心,昇騰異構計算架構 CANN 自2023年宣布深度開放策略至今,已構建起覆蓋全技術棧的開發者賦能體系,并成為中國開發者生態最活躍、技術迭代最迅猛的 AI 創新平臺,在使能 AI 開發效率和性能方面始終保持業界前列。

我們發現,昇騰 CANN 的進化始終錨定更深層的技術突破。從大模型爆發初期沉淀底層能力,到分層開放助力千行百業敏捷創新,再到扎根底層的技術創新,這條從能用到易用、好用的深度開放之路并不是一蹴而就的。

深度開放,CANN 的三層解耦戰略

隨著開發者的開發方式逐漸從上層軟件走向底層硬件,昇騰 CANN 的開放深度和開放策略也持續演進,構建起了覆蓋算子開發、系統調優到編譯鏈優化的全場景賦能體系。

過去,開發者往往受限于框架接口,難以直接干預硬件底層的精細調度。如今,得益于 CANN 深度開放,開發者既可以快速集成預置模塊完成敏捷交付,也可以直接調用最底層資源,靈活組合原子功能實現極致性能調優。這意味著開發者已能夠在性能與效率之間實現自由平衡。

具體來看,針對不同技術層級的開發者,昇騰 CANN 推出了差異化開放策略。

算法創新層,昇騰 CANN 在 Gitee 社區開源了包括 FlashAttention、Matmul 在內的260多個高性能算子及10余種 MESH/RING 通信算法的最佳實踐代碼庫,并提供了80多個高階API,開發者可基于業務場景直接調用預置算子庫或自定義優化已有算子及通信策略,顯著縮短開發周期。

同時在系統優化層,昇騰 CANN 也向開發者開放了190多個 Runtime 底層接口,支持開發者像拼裝樂高積木一樣靈活組合原子級能力,充分釋放昇騰硬件性能潛力。

編譯生態層,通過開放畢昇編譯器的 AscendNPU IR 接口,屏蔽硬件差異,底層硬件能力被高度抽象化,無感對接 Triton、FlagTree 等編程框架,開發者可直接使用 Python 語法編寫高性能算子。

全棧使能,核心突破加速產業創新

計算架構的核心使命,在于打通硬件性能釋放、軟件高效運行與生態協同繁榮的技術閉環。除了分層開放帶來的性能與效率的提升,昇騰 CANN 在計算、通信、內存三大維度也取得了核心技術的突破性進展。

計算加速層面,針對 MoE 大模型訓練場景的"卡脖子"難題,昇騰 CANN 推出了超級算子 MLAPO,通過將數個小算子融合,對 Vector 與 Cube 計算單元的并行化改造,成功將 MLA 前處理耗時從行業平均109us壓縮至45us,在金融風控模型、廣告推薦系統等業務實踐中實現了20%以上端到端的性能提升,打破了 Transformer 架構的算力瓶頸。

通信加速層面,傳統 RDMA 通信一次消息的傳輸需要三次同步,涉及到至少七次讀寫校驗核算過程,嚴重影響通信效率。昇騰 CANN 打造的 NPUDirect 通信算法可實現一個消息一次同步,端到端通信耗時降低了50%,大幅降低了推理時延。

內存優化層面,面對動態 shape 場景帶來的內存碎片化挑戰,昇騰 CANN 的多重地址映射技術能夠自動拼接利用內存碎片,顯著提升內存利用率。這項技術目前已在商品搜索、短視頻推薦等業務場景中,成功將內存利用率提升20%以上,并實現了單卡并發請求量的行業級突破。

實踐證明,架構開放的深度決定了技術的高度。昇騰 CANN 通過算法、系統、編譯三層深度解耦開放,賦予開發者直達硬件底層的能力,并以此為基礎在計算、通信、內存三大核心領域實現單點性能的指數級提升,同時構建起"芯片級優化-系統級調度-集群級協同"的全棧能力,開啟 AI 算力技術"原子級精準調優"的新紀元。

時間永遠站在行動者這邊。六年來,昇騰 CANN 深度開放策略的推進,驅動著技術突破與生態繁榮相互成就。無論是華南理工大學團隊利用全新發布的 CATLASS 算子模板庫開發 Matmul 算子,將開發周期從傳統4人周壓縮至2人周,還是科大訊飛星火大模型借 NPUDirect 通信算法,使跨機通信時延驟降90%,可以確定的是,越來越多的創新者正從中受益。

如今,昇騰 CANN 算子認證開發者已突破6000人,攜手互聯網、運營商、金融等30余個領域伙伴聯合開發核心算子超過260個。此外,昇騰還獲得了 Pytorch、vLLM 等主流社區的主動支持,一個根植于昇騰的開放 AI 大生態已蔚然成型。

開放層級的下探,正在重構 AI 創新效率的基線。伴隨模型迭代的急速演進與異構算力的協同瓶頸,解鎖硬件潛能的焦點已無爭議地轉向底層能力開放的更深處。這不僅是效率躍升的技術路徑,更是產業創新的核心范式。可以看到,當深度開放在算力底層扎下根系,創新應用的規?;涞乩顺币褎莶豢蓳酢?/p>

來源:思否編輯部

責任編輯:張誠
相關推薦

2025-07-01 16:04:52

2025-05-28 11:58:29

2025-06-18 13:29:42

昇騰CANN

2024-07-18 19:19:14

2020-08-12 18:29:25

昇騰

2022-11-11 15:47:00

昇騰AI

2022-10-18 11:37:03

鯤鵬

2023-06-19 13:27:46

昇騰AI

2020-08-18 10:17:48

昇騰上海技術開放日

2023-10-17 19:37:34

昇騰

2023-02-22 16:11:41

昇騰

2022-11-18 11:20:40

昇騰AI
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲一区黄色 | jlzzjlzz欧美大全 | 久久久青草 | www日韩 | 欧美特级黄色 | 国产精品一区二区三区免费观看 | 国产 日韩 欧美 在线 | 国产成人免费一区二区60岁 | 亚欧午夜 | 天堂久久天堂综合色 | 久久精品视频在线观看 | 免费的一级视频 | 日韩在线精品强乱中文字幕 | 久久亚洲欧美日韩精品专区 | 亚洲福利片 | 久久国产高清 | 蜜桃在线一区二区三区 | 日韩欧美一级片 | 国产精品高潮呻吟 | 自拍偷拍小视频 | 欧美天堂 | 丁香久久| 日本又色又爽又黄的大片 | 久久综合九色综合欧美狠狠 | 两性午夜视频 | 亚洲精品一区二区 | 久久久夜夜夜 | 91啪影院 | 国产日韩精品视频 | 9191在线观看 | 欧美午夜视频 | 欧州一区 | 在线色网址 | 欧美日韩精品影院 | 国产亚洲精品精品国产亚洲综合 | 亚洲狠狠| 欧美精品一区二区在线观看 | 日韩综合在线 | 亚洲欧美国产视频 | 一级毛片,一级毛片 | 欧洲国产精品视频 |