成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

全球首次,濕實驗證實!上交成功實現「蛋白質功能定向進化」,零數據跨入AGI時代

發布于 2024-4-30 12:54
瀏覽
0收藏

近日,上海交通大學自然科學研究院/物理與天文學院/張江高等研究院洪亮課題組,在生物信息學和人工智能研究領域的國際權威學術期刊JCIM(Journal of Chemical Information and Modeling)上發表最新研究成果:“基于微環境感知圖神經網絡構建指導蛋白質定向進化的通用人工智能 ”(Protein Engineering with Lightweight Graph Denoising Neural Networks)。

 

在此項研究中,該團隊設計了一種微環境感知圖神經網絡ProtLGN,能夠從蛋白質三維結構中學習有益的氨基酸突變位點,建立自然選擇下的氨基酸序列分布,用于指導蛋白質氨基酸位點設計,最終實現蛋白質指定功能的提升。

 

全球首次,濕實驗證實!上交成功實現「蛋白質功能定向進化」,零數據跨入AGI時代-AI.x社區

論文鏈接:??https://pubs.acs.org/doi/10.1021/acs.jcim.4c00036??

 

在生物化學實驗的基礎上,課題組證實了ProtLGN是一項通用的人工智能方法,在極少甚至沒有實驗數據的情況下,成功地實現了針對特定蛋白質性質的定向進化,包括提高抗體的親和力和穩定性、增強多種熒光蛋白的熒光強度,以及提升核酸內切酶的DNA切割活性。

 

也是全球首次,也是唯一一次經濕實驗驗證,可以利用通用人工智能模型,在極少實驗數據甚至無實驗數據下,實現不同蛋白特定性質的定向進化。

 

為什么研究ProtLGN?

 

人工智能的進步正在改變生命科學領域的研究方法和思維范式,尤其是在生物醫藥領域,而蛋白質設計作為該領域的關鍵技術之一,正受到人工智能技術的深刻影響。傳統的蛋白質設計方法存在效率低下、成本高昂、時間耗費長等難以解決的問題,基于深度學習的預測和篩選在蛋白質設計中被逐步應用并驗證。

 

但現有方法大多是基于多序列比對(MSA)或蛋白質語言模型(PLM)對蛋白質序列進行特征提取。前者高度依賴于同源序列的數量,但在實際應用中,并非所有蛋白質序列都能進行深度的同源比對;后者需要大量訓練數據和復雜的模型設計,導致訓練成本很高。

 

即使是使用當前主流的自然語言預訓練模型的思路,考慮到每個蛋白質都有獨特的性質和進化方向,使用通用預訓練模型處理獨特蛋白質時,不經重新訓練直接應用也會帶來泛化性和表達能力的挑戰。

 

ProtLGN是怎么做的?

 

洪亮團隊設計的能夠提取氨基酸周圍微觀環境信息的等變圖神經網絡的預訓練框架ProtLGN,結合蛋白質的結構信息對蛋白質上的每個氨基酸進行同步編碼,學習蛋白質三維結構中有益的氨基酸突變位點和突變類型,用于指導具有不同功能的蛋白質單位點突變和多位點突變設計。

 

全球首次,濕實驗證實!上交成功實現「蛋白質功能定向進化」,零數據跨入AGI時代-AI.x社區

ProtLGN框架示意圖

 

LGN的零樣本學習訓練框架如上圖所示。首先,輸入蛋白質數據集中的每個序列被k臨近鄰居算法轉換成一個蛋白質圖,并基于氨基酸性質提取出節點特征、邊特征、以及氨基酸的三維坐標信息。接著,對一部分的節點特征進行噪聲擾動后輸入到等變圖神經網絡中學習圖上的節點表示。

 

這一節點表示被全連接層解碼后可以預測多個不同的目標,比如去噪的節點氨基酸類型標簽,SASA和B-factor數值等。這里的預測誤差用于構建損失函數并傳導回網絡層進行反向傳導。在預測階段,模型輸出突變蛋白質的氨基酸概率,與野生型比對后,通過處理和計算得出突變體的評分。

 

為了驗證ProtLGN對蛋白質突變體活性的預測效果,作者在不同蛋白質的多種生理功能性質上進行了充分驗證,確保ProtLGN預測效果的通用性,包括VHH抗體、熒光蛋白(綠色、藍色、橙色)、核酸內切酶(KmAgo)等多種蛋白的熱穩定性、結合能力、熒光強度、單鏈DNA剪切活性等蛋白質工程常規關注和改造的多種關鍵功能指標。

 

全球首次,濕實驗證實!上交成功實現「蛋白質功能定向進化」,零數據跨入AGI時代-AI.x社區

ProtLGN框架示意圖熒光蛋白發光強度(FP),VHH抗體結合強度與熱穩定性,以及中溫核酸剪切酶(KmAgo)剪切活性的多點位突變結果


濕實驗結果表明,ProtLGN可以在沒有濕實驗數據或僅少量類似功能蛋白質的實驗數據基礎上達到40%的單點位改造成功率,并且在部分單位點上實現了多種功能協同提升。

 

上述結果表明ProtLGN能夠極大改善傳統蛋白質工程方法中成本高、成功率低、數據稀缺等問題。更為重要的是,本文首次使用深度學習模型在學習單位點突變體活性數據后,準確預測組合位點的活性,并且在單輪濕實驗中即可篩選出功能顯著優于低位點突變體的高位點突變體,表明ProtLGN能夠有效挖掘蛋白質定向進化中的正上位效應,為蛋白質的深度進化提供一條有效途徑。

 

ProtLGN作為一種新型的蛋白質設計方法,為生物學家和藥物研發人員提供了一個強大且可靠的計算工具。ProtLGN不僅能夠深入解析蛋白質的結構與功能的復雜關系,而且能夠突破傳統蛋白質設計方法遇到的瓶頸,為基于蛋白質的醫藥研究、生物技術開發等提供了全新并且有效的解決方案。


本文轉自 新智元 ,作者:新智元


原文鏈接:??https://mp.weixin.qq.com/s/LtXtzoxEdy2u_m19dRuWLA??

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 97福利在线 | 天堂亚洲网| 成人免费视频在线观看 | 99爱视频 | 日韩中文字幕网 | 欧美一区二区三区在线看 | 免费一级黄色 | 国产精品入口久久 | 日韩在线一区二区 | 亚洲一区二区三区四区五区午夜 | 在线视频国产一区 | 欧美日韩在线一区二区 | 欧美一区二区三区在线观看 | 久久综合久 | 91麻豆产精品久久久久久夏晴子 | 超碰在线人| 国产激情视频在线 | 久久国产成人 | 久久国产精品无码网站 | 男人天堂99 | 欧美日韩一区在线观看 | 精品一区二区三区在线播放 | 亚洲欧美在线观看 | 国产精品久久国产精品久久 | 亚洲aⅴ一区二区 | 久久草在线视频 | 久久国产精品一区二区 | 成人在线视频网站 | 男人的天堂中文字幕 | 成人日韩av| 成人福利在线 | 91精品国产日韩91久久久久久 | 国产精品视频二区三区 | 情侣黄网站免费看 | 成人免费观看网站 | 国产精品亚洲一区 | 精品久久久久久红码专区 | 免费视频一区二区三区在线观看 | 日韩一区二区三区在线看 | 日韩精品一区二区三区 | www中文字幕|