成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

DeepMind發布AlphaGenome,1秒內完成所有模態和細胞類型的變異效應預測 原創 精華

發布于 2025-6-26 14:48
瀏覽
0收藏

谷歌 DeepMind 的 Alpha 系列再添新成員——AlphaGenome,其能夠更全面、準確地預測人類 DNA 序列中單個變異或突變,如何影響一系列調控基因的生物過程。

AlphaGenome 模型以長達 100 萬個堿基對的 DNA 序列為輸入,預測數千種與其調控活性相關的分子屬性,同時還可以通過比較變異與未變異序列的預測結果,評估基因變異或突變的影響。該模型建立在 DeepMind 此前的基因組模型 Enformer 的基礎上,與專注于蛋白編碼區變異分類的 AlphaMissense 模型形成互補。

論文的共同一作 Jun Cheng 在其個人 X 賬號上介紹道,「RNA 剪接錯誤是許多疾病的常見成因,我們首次構建了一個統一模型,能夠同時預測 RNA-seq 覆蓋度、剪接位點、位點的使用情況,以及它們所形成的具體剪接連接點,從而更全面地描繪剪接結果的全貌」,同時他也指出,AlphaGenome 的重要突破之一便是「能夠直接從序列預測剪接連接點,并將其用于變異效應預測」。

Memorial Sloan Kettering 癌癥中心 Caleb Lareau 博士也評價道,「這是領域內的一個里程碑。我們首次擁有一個能同時兼具長上下文、單堿基精度和頂級性能的模型,并且覆蓋了廣泛基因組任務」。目前,DeepMind 已通過 AlphaGenome API 向非商業研究用戶開放 preview 版本,并計劃在未來正式發布該模型。

* 研究論文鏈接:

??https://go.hyper.ai/w9Jes??

基于 100 萬 DNA 序列及物種信息,采用類 U-Net 設計

如下圖 a 所示,深度學習模型 AlphaGenome 以 1 Mb(百萬堿基)DNA 序列及物種信息(人類/小鼠)作為輸入,用于預測涵蓋不同細胞類型的 5,930 條人類基因組軌跡或 1,128 條小鼠基因組軌跡,覆蓋 11 種輸出類型,包括:

* 基因表達(RNA-seq、CAGE、PRO-cap)

* 詳細的剪接模式(剪接位點、剪接位點使用頻率、剪接連接點)
* 染色質狀態(DNase、ATAC-seq、組蛋白修飾、轉錄因子結合)

* 染色質接觸圖

DeepMind發布AlphaGenome,1秒內完成所有模態和細胞類型的變異效應預測-AI.x社區

AlphaGenome 模型概覽


在模型架構方面,AlphaGenome 采用了類 U-Net 的主干架構設計,如下圖 a 所示,能夠高效地將輸入序列處理為兩種類型的序列表示:

* 一維嵌入(1-dimensional embeddings,分辨率為 1 bp 和 128 bp):表示線性基因組序列,用于生成基因組軌跡的預測;
* 二維嵌入(2-dimensional embeddings,分辨率 2048 bp):表示基因組片段之間的空間相互作用,用于預測成對的接觸圖。

DeepMind發布AlphaGenome,1秒內完成所有模態和細胞類型的變異效應預測-AI.x社區

AlphaGenome 模型總覽


該模型的卷積層用于建模局部序列模式,以支持精細預測;而 Transformer 模塊則用于建模更長距離的依賴關系,比如增強子與啟動子之間的相互作用。模型可以在完整的 1Mb 序列上進行以單堿基為單位的訓練,這得益于分布式的序列并行技術,能夠運行在 8 個互聯的 TPUv3 設備上。

在模型訓練方面,研究人員采用了兩階段訓練,即預訓練(Pre-training)與蒸餾(Distillation)。其中,在預訓練階段,其使用已有的實驗數據來訓練兩類模型,如下圖 b 所示:

* 折疊特定模型(fold-specific models):采用四折交叉驗證的方式進行訓練,即在參考基因組中使用 3/4 的區段進行訓練,將剩下的 1/4 留作驗證和測試。這些模型用于評估 AlphaGenome 在未見過的參考基因組區段上預測基因組軌跡的泛化能力。

* 全折疊模型(all-folds models):在參考基因組的所有可用區段上進行訓練,作為下一蒸餾階段的 Teachers 模型,如下圖 c 所示。

DeepMind發布AlphaGenome,1秒內完成所有模態和細胞類型的變異效應預測-AI.x社區

AlphaGenome 訓練流程


在蒸餾階段,研究人員訓練了一個共享預訓練架構的 Student 模型,其目標是利用經過隨機增強處理的輸入序列,預測出多個全折疊教師模型的綜合輸出。以往研究表明,這種蒸餾模型能夠在一個模型實例中同時實現更強的魯棒性和更高的變異效應預測(VEP)準確性。

得益于這一設計,該 Student 模型可以通過單次設備調用完成對所有模態和細胞類型的變異效應預測任務。在 NVIDIA H100 GPU 上,每個變異的預測用時不到一秒,使其在大規模變異效應預測中相比傳統多模型集成方法表現出極高的效率。

AlphaGenome 在各類基因組預測任務中表現領先

據 DeepMind 介紹,AlphaGenome 相較現有方法具備以下獨特優勢:

長序列上下文 + 單堿基分辨率

AlphaGenome 可分析長達百萬堿基的 DNA 序列,并在單堿基級別做出預測。這使其能覆蓋調控基因的遠程區域,同時捕捉精細的生物學細節。而此前的模型往往在執著于序列長度與預測精度之間平衡,限制了可建模的模態范圍和準確度。AlphaGenome 的技術突破打破了這一局限,其訓練僅用原 Enformer 模型一半的計算資源,僅需 4 小時即可完成一次訓練。

全面的多模態預測能力

高分辨率 + 長輸入序列的組合,使 AlphaGenome 能預測史無前例的多樣調控模態,為研究人員提供更系統的基因調控信息。

高效的變異打分

AlphaGenome 可在一秒鐘內對變異影響進行打分,通過比較變異前后序列的預測差異,并針對不同模態使用最合適的總結方法,它能快速、準確地評估基因變異對分子機制的潛在影響。

新穎的剪接位點建模

AlphaGenome 創新性地實現了直接基于序列預測 RNA 剪接連接點的位置及其表達水平。許多罕見遺傳病(如脊髓性肌萎縮癥、某些囊性纖維化類型)與剪接錯誤有關,該能力為相關病因研究提供了新工具。

基準測試表現優異

AlphaGenome 在各類基因組預測任務中表現領先。例如預測 DNA 結構接近區域、變異對基因表達的影響、對剪接模式的改變等。在 24 項 DNA 序列預測評估的 22 項中擊敗現有最佳模型,在 26 項變異效應任務的 24 項中達到或超過當前最優模型。更重要的是,其也是唯一一個可對所有評估模態進行聯合預測的模型,展示了極強的通用性。

具體而言,為了評估 AlphaGenome 的模型性能,研究人員首先考察了其對未見基因組區段的泛化能力,這是實現高質量變異效應預測的前提。他們共進行了 24 項基因組軌跡預測評估,涵蓋了模型所預測的全部 11 種模態。在交叉驗證折外評估(out-of-fold evaluations) 中,研究人員使用了預訓練的折疊特定 AlphaGenome 模型,并將其預測結果與每項任務中當前最強的外部模型進行比較。

結果顯示,AlphaGenome 在這 24 項評估中的 22 項上表現優于對應的外部模型,如下圖 d 所示。值得注意的是,在細胞類型特異的基因表達變化(log-fold change, LFC)預測任務中,AlphaGenome 相比另一款多模態序列模型 Borzoi 展現了 +17.4% 的相對性能提升,如下圖 e 所示。

此外,AlphaGenome 也在各任務上超越了專注于單一模態的專業模型。例如:

在染色質接觸圖(contact map)預測中,AlphaGenome 超過了 Orca 模型,表現為接觸圖 Pearson 相關系數提升 +6.3%,細胞類型特異差異提升 +42.3%,如下圖 d 所示;

在轉錄起始點軌跡預測中,AlphaGenome 優于 ProCapNet,整體計數 Pearson 相關系數提升 +15%;

在染色質可及性預測中,AlphaGenome 優于 ChromBPNet,在 ATAC-seq 上提升 +8%,在 DNase-seq 上提升 +19%。

DeepMind發布AlphaGenome,1秒內完成所有模態和細胞類型的變異效應預測-AI.x社區

* 左圖 d:AlphaGenome 在不同模態和分辨率的基因組軌跡預測任務中的相對性能提升(以 % 表示),PA 表示多聚腺苷酸化(polyadenylation)。

* 右圖 e:AlphaGenome 在部分變異效應預測任務中的相對性能提升。


行業里程碑獲高度評價

AlphaGenome 這一重磅模型的推出,從消息發布之時就開始持續在推特上引發各界熱議。

DeepMind 研究副總裁 Pushmeet Kohli 介紹道,「AlphaGenome 通過預測 DNA 變異的影響,提供了人類非編碼基因組的全面觀點。它將加深我們對疾病生物學的理解,并開辟新的研究途徑」。評論區,除了驚嘆夸贊之外,大家更加關心如何使用。

DeepMind發布AlphaGenome,1秒內完成所有模態和細胞類型的變異效應預測-AI.x社區

一名來自愛丁堡大學遺傳學的博士生稱,「這個模型或許可以徹底重新定義我們發現致病突變和藥物靶點的方式,它意義非凡」。

DeepMind發布AlphaGenome,1秒內完成所有模態和細胞類型的變異效應預測-AI.x社區

一位生物科學領域的評論員稱「AlphaGenome 不僅僅是單個基因,而是整個調控基因組。如果把 DNA 比作是代碼,而 AlphaGenome 就是由代碼組成的軟件」。

DeepMind發布AlphaGenome,1秒內完成所有模態和細胞類型的變異效應預測-AI.x社區

在實際應用方面,AlphaGenome 具有廣泛的科研潛力,例如面向疾病機制研究,其可更精確地預測基因變異對調控過程的影響,識別潛在致病變異,揭示新靶點,尤其適合研究具有顯著效應的罕見變異。在合成生物學領域,其能夠指導特定調控功能的 DNA 設計,例如只在神經細胞中激活目標基因。在基礎基因組學研究中,其可以加快關鍵功能元件的定位與角色定義,幫助識別調控特定細胞類型功能所需的「核心指令」。

倫敦大學學院 Marc Mansour 教授評價道,「在大規模識別非編碼變異的作用時,AlphaGenome 提供了關鍵的拼圖碎片,讓我們能更好地理解癌癥等復雜疾病」。目前,AlphaGenome 以面向非商業用途的研究開放,期待學術界基于此有更多成果產出。

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 免费三级网站 | 久久99精品国产 | 国产91色在线 | 亚洲 | 久久大香 | 成人黄页在线观看 | 中文字幕一区二区三区不卡 | 一区二区视频 | 99re99| 99色视频 | www.99精品| 久产久精国产品 | 国产乱码精品一区二区三区五月婷 | 亚洲国产精品一区二区三区 | 日本人爽p大片免费看 | 福利视频一区二区三区 | 亚洲成人第一页 | 日本一区二区三区视频在线 | 亚洲日本激情 | 可以在线观看av的网站 | av黄色国产 | 久久精品国产一区 | 亚洲一区二区三区视频免费观看 | 在线观看中文字幕dvd播放 | 精品国产精品国产偷麻豆 | 久久久久久久久久久久久9999 | 免费成人av网站 | 中文在线a在线 | 逼逼网| 九九久久精品 | 精品国产99 | 2021天天干夜夜爽 | 天天色影视综合 | 欧美亚洲一区二区三区 | 日韩一二三区 | 91天堂网 | 欧美白人做受xxxx视频 | 理论片午午伦夜理片影院 | 日本成人二区 | 国产精品99久久久久久宅男 | 一区二区三区小视频 | 精品av久久久久电影 |