DeepMind 開源 AlphaFold 2,生命科學(xué)領(lǐng)域或迎來巨變
DeepMind 近日在《自然》雜志上發(fā)表了一篇論文,在論文中 DeepMind 詳細(xì)介紹了 AlphaFold 2 ,并正式開源了 AlphaFold 2,借助 AlphaFold 2 的人工智能系統(tǒng)可以更加準(zhǔn)確的預(yù)測(cè)蛋白質(zhì)的形狀。DeepMind 表示,隨著代碼庫對(duì)外公開希望能夠擴(kuò)大 AlphaFold 2 在醫(yī)療保健和生命科學(xué)等領(lǐng)域的使用。
2018 年 12 月,DeepMind 試圖用 AlphaFold 解決蛋白質(zhì)折疊的挑戰(zhàn),DeepMind 當(dāng)時(shí)表示,AlphaFold 可以比之前的解決方案更精確地預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)。經(jīng)過兩年時(shí)間的改進(jìn),AlphaFold 2 于 2020 年 12 月推出,新版本進(jìn)行了多項(xiàng)改進(jìn),大幅提升了蛋白質(zhì)折疊預(yù)測(cè)。在第 14 屆 CASP 的評(píng)估結(jié)果中,AlphaFold 2 的平均誤差僅有 0.1 納米(相當(dāng)于一個(gè)原子的寬度),人工智能的預(yù)測(cè)結(jié)果可與實(shí)驗(yàn)方法的結(jié)果相媲美。近日 DeepMind 則正式將 AlphaFold 2 開源。
蛋白質(zhì) —— 由氨基酸組成的大分子,是組織、肌肉、毛發(fā)、酶、抗體和其他生物體的基本組成部分 —— 是在 DNA 中編碼的。正是這些基因定義限制了他們的三維結(jié)構(gòu),進(jìn)而決定了他們的能力。但是蛋白質(zhì)的 "折疊",僅僅從相應(yīng)的基因序列中是很難弄清楚的。DNA 只包含關(guān)于氨基酸殘基鏈的信息,而不是這些鏈的最終形式。
正如上段所述,蛋白質(zhì)的形狀很重要,因?yàn)樗兄诖_定該蛋白質(zhì)的功能。大多數(shù)藥物通過與蛋白質(zhì)結(jié)構(gòu)中形狀非常特殊的 "口袋" 結(jié)合而發(fā)揮作用。因此,了解蛋白質(zhì)的確切形狀可能是開發(fā)新藥的關(guān)鍵一步,AlphaFold 2 有可能加速藥物研發(fā)與發(fā)現(xiàn)。
AlphaFold 從生物學(xué)、物理學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域獲得了靈感。 它利用了這樣一個(gè)事實(shí),即一個(gè)折疊的蛋白質(zhì)可以被認(rèn)為是一個(gè) "空間圖"。AlphaFold 利用一種人工智能算法,試圖解釋這個(gè)圖的結(jié)構(gòu),同時(shí)利用進(jìn)化相關(guān)的序列、多序列比對(duì)和氨基酸殘基對(duì)的表示法對(duì)它正在構(gòu)建的隱性圖進(jìn)行推理。
在開源版本中,DeepMind 大大簡(jiǎn)化了 AlphaFold 2。原本該系統(tǒng)需要數(shù)天的計(jì)算時(shí)間才能為 CASP 的一些條目生成結(jié)構(gòu),而開源版本的速度大約提升了 16 倍。依據(jù)蛋白質(zhì)的大小它可以在幾分鐘到幾小時(shí)內(nèi)生成結(jié)構(gòu)。
DeepMind 認(rèn)為,如果進(jìn)一步完善 AlphaFold,未來可以將其應(yīng)用于此前蛋白質(zhì)折疊領(lǐng)域難以解決的問題,包括與流行病學(xué)工作相關(guān)的問題。去年,DeepMind 預(yù)測(cè)了 SARS-CoV-2 的幾個(gè)蛋白質(zhì)結(jié)構(gòu),其中包括 ORF3a,而在此之前 ORF3a 的構(gòu)成一直是一個(gè)謎。在 CASP 14 上,DeepMind 還預(yù)測(cè)了另一種冠狀病毒蛋白 ORF8 的結(jié)構(gòu),該結(jié)構(gòu)后來被科研人員所證實(shí)。
除了幫助應(yīng)對(duì)流行病,DeepMind 預(yù)計(jì) AlphaFold 2 還將被用于探索目前缺乏模型的數(shù)以億計(jì)的蛋白質(zhì)。在公開的通用蛋白質(zhì)數(shù)據(jù)庫中,目前有 1.8 億個(gè)蛋白質(zhì)序列,而只有大約 17 萬個(gè)蛋白質(zhì)結(jié)構(gòu)。
DeepMind 表示,它致力于使 AlphaFold "規(guī)模化",并與合作伙伴共同探索新的前沿領(lǐng)域,如多種蛋白質(zhì)如何形成復(fù)合物并與 DNA、RNA 和小分子相互作用。今年早些時(shí)候,DeepMind 還宣布與位于日內(nèi)瓦的 "Drugs for Neglected Diseases Initiative" 建立新的合作關(guān)系,該組織利用 AlphaFold 確定了非昔硝唑(Fexinidazole)作為有毒化合物美拉胂醇(Melarsoprol)的替代品用于治療昏睡病。
本文轉(zhuǎn)自O(shè)SCHINA
本文標(biāo)題:DeepMind 開源 AlphaFold 2,生命科學(xué)領(lǐng)域或迎來巨變
本文地址:https://www.oschina.net/news/151434/deepmind-alphafold-2-for-protein-structure-predictions