成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

首個大眾可用PyTorch版AlphaFold2復現,哥大開源,star量破千

人工智能 新聞
AlphaFold2 是 2021 年 AI for Science 領域最耀眼的一顆星。現在,有人在 PyTorch 中復現了它,并已在 GitHub 上開源。這一復現在性能上媲美原版 AlphaFold2,且在算力、存儲方面的要求對于大眾來說更加友好。

首個大眾可用PyTorch版AlphaFold2復現,哥大開源,star量破千

剛剛,哥倫比亞大學系統生物學助理教授 Mohammed AlQuraishi 在推特上宣布,他們從頭訓練了一個名為 OpenFold 的模型,該模型是 AlphaFold2 的可訓練 PyTorch 復現版本。Mohammed AlQuraishi 還表示,這是第一個大眾可用的 AlphaFold2 復現。

首個大眾可用PyTorch版AlphaFold2復現,哥大開源,star量破千

AlphaFold2 可以周期性地以原子精度預測蛋白質結構,在技術上利用多序列對齊和深度學習算法設計,并結合關于蛋白質結構的物理和生物學知識提升了預測效果。它實現了 2/3 蛋白質結構預測的卓越成績并在去年登上了《自然》雜志。更令人驚喜的是,DeepMind 團隊不僅開源了模型,還將 AlphaFold2 預測數據做成了免費開放的數據集。

然而,開源并不意味著能用、好用。其實,AlphaFold2 軟件系統的部署難度極大,并且對硬件的要求高、數據集下載周期長、占用空間大,每一條都讓普通開發者望而卻步。因此,開源社區一直在努力實現 AlphaFold2 的可用版本。

這次哥倫比亞大學 Mohammed AlQuraishi 教授等人實現的 OpenFold 總訓練時間大約為 100000 A100 小時,但在大約 3000 小時內就達到了 90% 的準確率。

首個大眾可用PyTorch版AlphaFold2復現,哥大開源,star量破千

OpenFold 與原版 AlphaFold2 的準確率相當,甚至略勝一籌,可能因為 OpenFold 的訓練集更大一點:

首個大眾可用PyTorch版AlphaFold2復現,哥大開源,star量破千

OpenFold 的主要優勢是推理速度顯著提升,對于較短的蛋白質序列,OpenFold 的推理速度可以達到 AlphaFold2 的兩倍。另外,由于使用自定義的 CUDA 內核,OpenFold 使用更少的內存就能推理更長的蛋白質序列。

OpenFold 介紹

OpenFold 幾乎再現了原始開源推理代碼 (v2.0.1) 的所有功能,除了已趨于被淘汰的「模型集成」功能,該功能在 DeepMind 自己的消融測試中就表現不佳。

無論是否有 DeepSpeed,OpenFold 都能以全精度或 bfloat16 進行訓練。為了實現 AlphaFold2 的原始性能,該團隊從頭開始訓練 OpenFold,現已公開發布了模型權重和訓練數據。其中,訓練數據包含大約 400000 份 MSA 和 PDB70 模板文件。OpenFold 還支持使用 AlphaFold 的官方參數進行蛋白質推理。

與其他實現相比,OpenFold 具有以下優點:

  • 短序列推理:加快了在 GPU 上推理少于 1500 個氨基酸殘基的鏈的速度;
  • 長序列推理:通過該研究實現的低記憶注意力(low-memory attention)對極長鏈進行推理,OpenFold 可以在單個 A100 上預測 超過 4000 個殘基的序列結構,借助 CPU offload 甚至可以預測更長的序列;
  • 內存高效在訓練和推理期間,在 FastFold 內核基礎上修改的自定義 CUDA 注意力內核,使用的 GPU 內存分別比等效的 FastFold 和現有的 PyTorch 實現少 4 倍和 5 倍;
  • 高效對齊腳本:該團隊使用原始 AlphaFold HHblits/JackHMMER pipeline 或帶有 MMseqs2 的 ColabFold,已經生成了數百萬個對齊。

Linux 系統下的安裝與使用

開發團隊提供了一個在本地安裝 Miniconda、創建 conda 虛擬環境、安裝所有 Python 依賴項并下載有用資源的腳本,包括兩組模型參數。

運行以下命令:

scripts/install_third_party_dependencies.sh

使用如下命令激活環境:

source scripts/activate_conda_env.sh

停用命令:

source scripts/deactivate_conda_env.sh

在激活環境下,編譯 OpenFold 的 CUDA 內核

python3 setup.py install

在 / usr/bin 路徑下安裝 HH-suite:

# scripts/install_hh_suite.sh

使用如下命令可以下載用于訓練 OpenFold 和 AlphaFold 的數據庫:

bash scripts/download_data.sh data/

如果要使用一組 DeepMind 的預訓練參數對一個或多個序列進行推理,可以運行如下代碼:

python3 run_pretrained_openfold.py \
fasta_dir \
data/pdb_mmcif/mmcif_files/ \
--uniref90_database_path data/uniref90/uniref90.fasta \
--mgnify_database_path data/mgnify/mgy_clusters_2018_12.fa \
--pdb70_database_path data/pdb70/pdb70 \
--uniclust30_database_path data/uniclust30/uniclust30_2018_08/uniclust30_2018_08 \
--output_dir ./ \
--bfd_database_path data/bfd/bfd_metaclust_clu_complete_id30_c90_final_seq.sorted_opt \
--model_device "cuda:0" \
--jackhmmer_binary_path lib/conda/envs/openfold_venv/bin/jackhmmer \
--hhblits_binary_path lib/conda/envs/openfold_venv/bin/hhblits \
--hhsearch_binary_path lib/conda/envs/openfold_venv/bin/hhsearch \
--kalign_binary_path lib/conda/envs/openfold_venv/bin/kalign
--config_preset "model_1_ptm"
--openfold_checkpoint_path openfold/resources/openfold_params/finetuning_2_ptm.pt

更多細節請參見 GitHub:https://github.com/aqlaboratory/openfold

首個大眾可用PyTorch版AlphaFold2復現,哥大開源,star量破千

擴展閱讀:

  • 高效預測幾乎所有人類蛋白質結構,AlphaFold 再登 Nature,數據庫全部免費開放
  • 生物計算專家超細致解讀 AlphaFold2 論文:模型架構及應用
  • DeepMind 開源的 AlphaFold 怎么用?打開 Colab 就能在線用
責任編輯:張燕妮 來源: 機器之心Pro
相關推薦

2024-02-19 08:56:00

AI模型

2020-08-18 14:48:00

AI 數據人工智能

2023-09-20 12:44:00

AI訓練

2021-07-21 17:13:17

DeepMind開源AlphaFold 2

2021-07-16 14:16:51

AI 算法人工智能

2021-07-22 10:12:00

神經網絡數據圖形

2025-03-20 09:20:00

2024-07-08 08:15:00

2023-03-02 14:00:03

AI繪畫

2023-11-05 10:01:37

AI模型

2022-02-14 00:04:24

AI蛋白質結構

2022-03-21 15:23:43

AI研究抗體

2022-07-22 14:49:37

語言模型DeepMindAlphaFold2

2024-07-15 12:18:39

2023-07-28 15:39:20

TransGPT人工智能開源

2024-09-09 14:15:00

AI訓練

2009-02-12 11:11:07

MoonlightSilverlightMono

2023-07-06 13:23:49

2021-07-24 10:21:46

模型人工智能深度學習

2024-09-12 15:10:00

AI智能體
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 羞羞色影院 | 精品在线播放 | 亚洲网站在线观看 | 中文字幕亚洲欧美 | 91在线看 | 精品视频在线观看 | 一区二区三区国产 | 中文字幕av一区 | 三级在线视频 | 亚洲欧美日韩在线 | 色综合一区二区三区 | 欧美一级二级三级视频 | 91久久久久 | 日韩aⅴ在线观看 | 特黄特黄a级毛片免费专区 av网站免费在线观看 | 黄频免费| 亚洲三区在线观看 | 97视频久久 | 欧美一区二区三区四区五区无卡码 | 在线观看免费福利 | 国产成人av在线播放 | 国产精品一区二区久久 | 中文字幕av亚洲精品一部二部 | 青草福利| 91精品国产高清一区二区三区 | 久久人人爽人人爽人人片av免费 | 一区二区三区四区视频 | 狠狠狠色丁香婷婷综合久久五月 | 久久久999免费视频 999久久久久久久久6666 | 国产在线观看一区二区三区 | 狠狠躁天天躁夜夜躁婷婷老牛影视 | 久久精品a级毛片 | 少妇一区二区三区 | 欧美日本在线观看 | 国产欧美精品 | 久久高清精品 | 亚洲综合无码一区二区 | 日本在线免费视频 | 黄片毛片在线观看 | 精品久久久久一区 | 成人av免费网站 |