成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大規模實用化量子化學計算曙光顯現,ByteDance Research開源工具集ByteQC

人工智能 新聞
字節跳動 ByteDance Research 團隊開發并開源的 ByteQC 軟件包克服了 GPU 開發過程中顯存受限,復雜邏輯難以高效實現的問題,實現了量子化學方法的高效 GPU 化。

真實化學體系包含大量的微觀粒子,其精確的嚴格計算需要指數高的復雜度,對這些體系的模擬一直是材料、制藥和催化等領域的難點和前沿。

為了解決這一問題,近日字節跳動 ByteDance Research 團隊開發并開源了 ByteQC —— 基于 GPU 加速的大規模量子化學計算工具集。該工具集使用強大的 GPU 算力,大幅度加速了常見的量子化學算法,同時結合領域內前沿的量子嵌入方法實現了量子化學「黃金標準」精度下的大規模量子化學體系的模擬。論文以大尺寸分子團簇,表面吸附問題為例,展示了 ByteQC 在真實材料計算中的應用潛力。

圖片

  • 論文鏈接:https://arxiv.org/abs/2502.17963
  • 代碼鏈接:https://github.com/bytedance/byteqc

該論文作者中還包括 NVIDIA 和北京大學的合作者。

摘要

在大規模體系中應用量子化學算法需要大量的計算資源,并且計算資源的需求隨著體系規模和所需精度的提高而增長。字節團隊開發并發展了開源項目 ByteQC(ByteDance Quantum Chemistry)。

在硬件層面,ByteQC 在現代 GPU 上高效實現了多種標準量子化學算法,包括平均場計算(Hartree-Fock 方法和密度泛函理論)以及后 Hartree-Fock 方法(如 M?ller-Plesset 微擾理論、隨機相位近似、耦合簇方法和量子蒙特卡洛方法)。

在算法層面,ByteQC 提供了一種量子嵌入方法,該方法在保持量子化學「黃金標準」精度的同時,顯著擴展了可計算的體系規模。

圖片

圖 1. ByteQC 軟件架構

方法

GPU 的顯存顯著小于 CPU 內存,同時架構的不同導致很多 CPU 可以高效實現的復雜邏輯在 GPU 上很難實現。為了解決這些問題 ByteQC 在開發過程中主要使用了以下方法:

1. 引入高效計算庫

張量縮并是量子化學計算的主要熱點之一,為此作者團隊引入了 NVIDIA 提供的高效張量計算庫 cuTENSR/cuTENSORMG。該計算庫在最小占用顯存的前提下高效計算張量縮并。作者團隊完善了相關的函數封裝,將其引入到了 Python / Cupy 的生態中。

2. 高效實現復雜計算邏輯

在周期性體系屏蔽計算中需要在 GPU 上實現高效的動態生產者 - 消費者模型,作者團隊提出使用動態的 warp 特例化高效實現。在平均場 Fock 矩陣構建中,涉及相鄰任意多的線程競態求和的問題。CUDA 自帶求和函數并未針對該特殊情況優化,作者團隊使用 warp 內的 shuffle 指令實現了高效地求和。

圖片

圖 2. 基于 warp 特例化的生產者-消費者模型

圖片

圖 3. 基于 warp 同步原語的相鄰 7 個線程的競態求和

3. 優化緩存和簡單高效的原位操作
ByteQC 的諸多代碼實現均進行了詳細的緩存分析,最大限度地實現了緩存的復用,減少了顯存需求。此外大量地使用 Cupy 提供的 kernel 接口,通過 CUDA kernel 實現了原位操作,減少了顯存的占用。

結果

基準測試表明相比于 100 核 CPU,ByteQC 的標準量子化學算法最高可實現單 A100 GPU 60 倍加速,大多數模塊的多卡標度可達到線性加速。對應可以單 GPU 計算的體系規模也大幅提升:

  • 耦合簇單、雙激發(CCSD):1,610 軌道
  • 帶微擾三重激發(CCSD (T)):1,380 軌道
  • 二階 M?ller-Plesset 微擾理論(MP2):11,040 軌道
  • 開放邊界條件下的平均場計算:37,120 軌道
  • 周期邊界條件下的平均場計算:超過 100,000 軌道

圖片

圖 4. ByteQC 的子模塊加速比(數據點)和計算規模(虛線)

此外,結合 ByteQC 中提供的量子嵌入功能,團隊在 2,753 軌道的水團簇問題和 3,929 軌道的氮化硼表面水吸附問題上均實現了 CCSD (T) 水平的「黃金標準」精度的計算。

圖片

圖 5. (左)水團簇結構和(右)氮化硼表面水吸附結構

總結

字節跳動 ByteDance Research 團隊開發并開源的 ByteQC 軟件包克服了 GPU 開發過程中顯存受限,復雜邏輯難以高效實現的問題,實現了量子化學方法的高效 GPU 化。

此外,結合量子嵌入方法,ByteQC 可以在保持 CCSD (T) 的精度的前提下,計算更大的規模。通過這些創新和優化,ByteQC 有望成為推動量子化學領域發展的工具。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2020-08-28 15:39:26

谷歌量子計算開發者

2023-04-12 15:58:58

2022-04-12 14:23:52

安卓cpu

2023-09-10 13:18:10

算法量子化

2022-03-21 11:18:48

機器學習量子計算開發

2022-03-02 10:52:30

量子計算科學家量子處理器

2024-02-29 11:53:22

神經網絡NNVMC偏微分方程求解器

2020-11-16 08:54:05

Google 開源技術

2017-05-08 14:56:07

開源Prophet預測

2016-01-29 20:23:23

華為

2017-02-28 19:27:22

Facebook開源Prophet

2022-01-20 16:05:02

Nature論文研究

2020-10-15 19:22:09

Menger機器學習強化學習

2018-10-19 12:16:06

開源技術 數據

2025-02-24 10:09:18

2023-04-06 16:29:18

模型AI

2018-09-10 15:02:51

開源技術 數據

2023-10-26 01:26:04

Vaex數據數據集
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人精品一区二区 | 成人免费看片网 | 米奇7777狠狠狠狠视频 | 久久久精品一区 | 精品国产一级 | 91视频88av| 精品免费| 亚洲精品一区二区在线观看 | 久久爱综合 | 亚洲国产第一页 | 亚洲国产精品视频 | 91视视频在线观看入口直接观看 | 婷婷丁香综合网 | 国产区视频在线观看 | 日韩黄色小视频 | 欧美精品久久 | 91久久久久久久久久久 | 欧美精品二区 | 少妇性l交大片免费一 | 91精品国产一区二区三区 | 亚洲综合无码一区二区 | 一级国产精品一级国产精品片 | 国产日韩欧美 | 国产精品美女久久久久aⅴ国产馆 | 岛国毛片在线观看 | 欧美精品一区三区 | 天天欧美| www..com18午夜观看 | 夜夜草 | 在线午夜 | 91精品国产乱码久久久久久久久 | 一级黄色片日本 | 国产1页 | 一级片片 | 欧美成ee人免费视频 | 午夜影院在线免费观看视频 | 日韩欧美国产精品一区 | 国产精品久久久久久久久久三级 | 国产日产久久高清欧美一区 | 麻豆久久精品 | 九九热在线免费视频 |