成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

超越諾獎(jiǎng)?生物界「ChatGPT」首次實(shí)現(xiàn)從零合成全新蛋白,登Nature子刊!

人工智能 新聞
這家成立三年的小初創(chuàng)公司,首次利用深度學(xué)習(xí)語(yǔ)言模型合成出了自然界中不存在的全新蛋白質(zhì),引爆蛋白質(zhì)設(shè)計(jì)革命。

人工智能的應(yīng)用,已經(jīng)極大地加速了蛋白質(zhì)工程的研究。

最近,加州伯克利的一家初出茅廬的初創(chuàng)公司再次取得了驚人的進(jìn)步。

科學(xué)家們采用類(lèi)似ChatGPT的蛋白質(zhì)工程深度學(xué)習(xí)語(yǔ)言模型——Progen,首次實(shí)現(xiàn)了AI預(yù)測(cè)蛋白質(zhì)的合成。

圖片

這些蛋白質(zhì)不僅與已知的完全不同,相似度最低的甚至只有31.4%,但和天然蛋白一樣有效。

現(xiàn)在,這項(xiàng)工作已經(jīng)正式發(fā)表于Nature子刊。

圖片

論文地址:https://www.nature.com/articles/s41587-022-01618-2

這個(gè)實(shí)驗(yàn)也表明,自然語(yǔ)言處理雖然是為讀寫(xiě)語(yǔ)言文本而開(kāi)發(fā)的,但它也可以學(xué)習(xí)生物學(xué)的一些基本原理。

比肩諾獎(jiǎng)的技術(shù)

對(duì)此,研究人員表示,這項(xiàng)新技術(shù)可能會(huì)變得比定向進(jìn)化(獲得諾貝爾獎(jiǎng)的蛋白質(zhì)設(shè)計(jì)技術(shù))更加強(qiáng)大。

「它將通過(guò)加快開(kāi)發(fā)可用于從治療劑到降解塑料等幾乎所有用途的新蛋白質(zhì),為有50年歷史的蛋白質(zhì)工程領(lǐng)域注入活力。」

圖片

這家公司名叫Profluent,由前Salesforce AI研究負(fù)責(zé)人創(chuàng)立,已獲得900萬(wàn)美元的啟動(dòng)資金,用于建立一個(gè)集成的濕實(shí)驗(yàn)室,并招募機(jī)器學(xué)習(xí)科學(xué)家和生物學(xué)家。

以往,在自然界中挖掘蛋白質(zhì),或者調(diào)整蛋白質(zhì)到所需功能,都十分費(fèi)力。Profulent的目標(biāo)是,讓這個(gè)過(guò)程變得毫不費(fèi)力。

他們做到了。

圖片

Profluent創(chuàng)始人兼CEO Ali Madani

Madani在采訪中表示,Profulent已經(jīng)設(shè)計(jì)出了多個(gè)家族的蛋白質(zhì)。這些蛋白質(zhì)的功能與樣本蛋白(exemplar proteins)一樣,因此是具有高活性的酶。

這項(xiàng)任務(wù)非常困難,是以zero-shot的方式完成的,這意味著并沒(méi)有進(jìn)行多輪優(yōu)化,甚至根本不提供濕實(shí)驗(yàn)室的任何數(shù)據(jù)。

而最終設(shè)計(jì)出的蛋白質(zhì),是通常需要數(shù)百年才能進(jìn)化出來(lái)的高活性蛋白質(zhì)。

圖片

基于語(yǔ)言模型的ProGen

作為深度神經(jīng)網(wǎng)絡(luò)的一種,條件語(yǔ)言模型不僅可以生成語(yǔ)義和語(yǔ)法正確且新穎多樣的自然語(yǔ)言文本,而且還可以利用輸入控制標(biāo)簽來(lái)指導(dǎo)風(fēng)格、主題等等。

類(lèi)似的,研究人員開(kāi)發(fā)出了今天的主角——ProGen,一個(gè)12億參數(shù)的條件蛋白質(zhì)語(yǔ)言模型。

具體來(lái)說(shuō),基于Transformer架構(gòu)的ProGen通過(guò)自注意機(jī)制來(lái)模擬殘基的相互作用,并且可以根據(jù)輸入控制標(biāo)簽生成不同的跨蛋白質(zhì)家族的人工蛋白質(zhì)序列。

圖片

用條件語(yǔ)言模型生成人工蛋白質(zhì)

為了創(chuàng)建這個(gè)模型,研究人員喂了2.8億種不同蛋白質(zhì)的氨基酸序列,并讓它「消化」了幾周的時(shí)間。

接著,他們又用五個(gè)溶菌酶家族的56,000個(gè)序列以及關(guān)于這些蛋白質(zhì)的信息,對(duì)模型進(jìn)行了微調(diào)。

Progen的算法與ChatGPT背后的模型GPT3.5類(lèi)似,它學(xué)習(xí)到了蛋白質(zhì)中氨基酸排序的規(guī)律,以及它們與蛋白結(jié)構(gòu)和功能的關(guān)系。

很快,模型就生成了一百萬(wàn)個(gè)序列。

根據(jù)與天然蛋白質(zhì)序列的相似程度,以及氨基酸「語(yǔ)法」和「語(yǔ)義」的自然程度,研究人員選擇了100個(gè)進(jìn)行測(cè)試。

其中,有66個(gè)產(chǎn)生了與消滅蛋清和唾液中細(xì)菌的天然蛋白質(zhì)類(lèi)似的化學(xué)反應(yīng)。

也就是說(shuō),這些由AI生成的新蛋白質(zhì)也可以殺死細(xì)菌。

圖片

生成的人工蛋白是多樣化的,且在實(shí)驗(yàn)系統(tǒng)中表達(dá)良好

更進(jìn)一步,研究人員選擇了反應(yīng)最強(qiáng)烈的五種蛋白質(zhì),并將它們加入到大腸桿菌的樣本中。

其中,有兩種人工酶能夠分解細(xì)菌的細(xì)胞壁。

通過(guò)與雞蛋白溶菌酶(HEWL)進(jìn)行比較可以發(fā)現(xiàn),它們的活性與HEWL相當(dāng)。

隨后,研究人員又用X射線進(jìn)行了成像。

盡管人工酶的氨基酸序列與現(xiàn)有的蛋白質(zhì)有高達(dá)30%的差異,二者之間也只有18%是相同的,但它們的形狀卻與自然界的蛋白質(zhì)相差無(wú)幾,而且功能也可以與之媲美。

圖片

條件語(yǔ)言建模對(duì)其他蛋白質(zhì)系統(tǒng)的適用性

除此之外,對(duì)于高度進(jìn)化的天然蛋白質(zhì)來(lái)說(shuō),可能只需一個(gè)小小突變就會(huì)讓它停止工作。

但研究人員在另一輪篩選中發(fā)現(xiàn),在AI生成的酶中,即使只有31.4%的序列與已知蛋白質(zhì)相同,也能表現(xiàn)出相當(dāng)?shù)幕钚砸约邦?lèi)似的結(jié)構(gòu)。

圖片

蛋白質(zhì)設(shè)計(jì),進(jìn)入新時(shí)代

可以看到,ProGen的工作方式與ChatGPT很類(lèi)似。

ChatGPT通過(guò)學(xué)習(xí)海量數(shù)據(jù),可以參加MBA和律師考試、撰寫(xiě)大學(xué)論文。

而ProGen通過(guò)學(xué)習(xí)氨基酸如何組合成2.8億個(gè)現(xiàn)有蛋白質(zhì)的語(yǔ)法,學(xué)會(huì)了如何生成新的蛋白質(zhì)。

圖片

在采訪中,Madani表示,「就像ChatGPT學(xué)習(xí)英語(yǔ)之類(lèi)的人類(lèi)語(yǔ)言一樣,我們是在學(xué)習(xí)生物和蛋白質(zhì)的語(yǔ)言。」

「人工設(shè)計(jì)蛋白質(zhì)的性能比受進(jìn)化過(guò)程啟發(fā)的蛋白質(zhì)要好得多,」論文作者之一、加州大學(xué)舊金山分校藥學(xué)院生物工程和治療科學(xué)教授James Fraser說(shuō)。

「語(yǔ)言模型正在學(xué)習(xí)進(jìn)化的各個(gè)方面,但它與正常的進(jìn)化過(guò)程不同。我們現(xiàn)在有能力調(diào)整這些特性的產(chǎn)生,以獲得特定效果。比如,讓一種酶具有令人難以置信的熱穩(wěn)定性,或嗜好酸性環(huán)境,或者不會(huì)與其他蛋白質(zhì)相互作用。」

早在2020年,Salesforce Research就開(kāi)發(fā)了ProGen。它基于的自然語(yǔ)言編程,最初用于生成英語(yǔ)文本。

從之前的工作中,研究者們了解到,人工智能系統(tǒng)可以自學(xué)語(yǔ)法和單詞的含義,以及其他使寫(xiě)作井井有條的基本規(guī)則。

「當(dāng)你用大量數(shù)據(jù)訓(xùn)練基于序列的模型時(shí),它們?cè)趯W(xué)習(xí)結(jié)構(gòu)和規(guī)則上的表現(xiàn)非常強(qiáng)大,」Salesforce Research人工智能研究總監(jiān)、論文的資深作者Nikhil Naik博士說(shuō),「它們會(huì)了解哪些詞可以同時(shí)出現(xiàn),該怎樣組合。」

「現(xiàn)在,我們已經(jīng)證明了ProGen有能力生成新的蛋白質(zhì),并進(jìn)行了公開(kāi)發(fā)布,所有人都可以在我們的基礎(chǔ)上進(jìn)行研究。」

圖片

作為蛋白質(zhì)的溶菌酶雖然非常小,最多有約300個(gè)氨基酸。

但是有20種可能的氨基酸,就有20^300種可能的組合。

這比古往今來(lái)的所有人類(lèi),乘以地球上沙粒的數(shù)量,再乘以宇宙中的原子數(shù)量的積還要多。

考慮到這近乎無(wú)限的可能性,Progen能夠如此輕松地設(shè)計(jì)出有效的酶,確實(shí)很了不起。

圖片

Profluent Bio創(chuàng)始人、Salesforce Research前研究科學(xué)家Ali Madani博士說(shuō):「開(kāi)箱即用地從頭開(kāi)始生成功能性蛋白質(zhì)的能力,表明我們正在進(jìn)入蛋白質(zhì)設(shè)計(jì)的新時(shí)代。」

「這是所有蛋白質(zhì)工程師都可以使用的多功能新工具,我們期待看到它被應(yīng)用于治療。」

與此同時(shí),研究人員仍在繼續(xù)改進(jìn)ProGen,試圖突破更多的限制和挑戰(zhàn)。

其中之一便它非常地依賴(lài)數(shù)據(jù)。

「我們已經(jīng)探索了通過(guò)加入基于結(jié)構(gòu)的信息來(lái)改善序列的設(shè)計(jì),」Naik說(shuō),「我們還在研究當(dāng)你沒(méi)有太多關(guān)于某個(gè)特定蛋白質(zhì)家族或領(lǐng)域的數(shù)據(jù)時(shí),如何提高模型的生成能力。」

值得注意的是,還有一些初創(chuàng)公司也在嘗試相似的技術(shù),比如Cradle,以及自生物技術(shù)孵化器Flagship Pioneering的Generate Biomedicines,不過(guò)這些研究都還未經(jīng)過(guò)同行評(píng)審。

責(zé)任編輯:張燕妮 來(lái)源: 新智元
相關(guān)推薦

2021-11-22 17:40:08

AI 神經(jīng)網(wǎng)絡(luò)人工智能

2024-08-22 18:45:27

2023-06-29 17:42:55

AI檢測(cè)

2022-02-23 14:36:31

AI數(shù)據(jù)研究

2023-03-13 13:24:34

智能Nature

2024-11-08 15:07:14

2023-10-24 19:43:34

2023-03-06 13:59:38

模型參數(shù)

2024-04-22 07:30:00

藥物分子模型

2024-05-27 08:20:00

2022-05-24 15:15:25

機(jī)器學(xué)習(xí)科學(xué)

2024-04-17 12:20:51

腦機(jī)接口深度學(xué)習(xí)人工智能

2025-04-03 09:45:51

2024-01-07 18:00:33

AI模型特點(diǎn)

2022-07-12 14:56:30

AI模型研究

2022-04-13 14:20:00

技術(shù)睡眠裝置

2020-11-17 14:53:54

騰訊 蛋白質(zhì)AI

2025-01-13 13:00:00

AI模型訓(xùn)練

2023-12-19 17:44:29

模型訓(xùn)練
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 亚洲成av人片在线观看无码 | 精品国产欧美一区二区 | 性天堂网 | 亚洲美女视频 | 毛片免费在线 | 亚洲男人网 | 久久久蜜桃一区二区人 | 欧美激情a∨在线视频播放 成人免费共享视频 | 正在播放国产精品 | 欧美日本一区二区 | 日韩欧美国产一区二区 | 亚洲色欲色欲www | 日韩免费一区二区 | 久久国产精品视频 | 精品久久久久久久久久久久 | 精品国产一区二区国模嫣然 | 国产精品美女久久久久久久久久久 | 在线看片国产 | 狠狠婷婷综合久久久久久妖精 | 久久国产精品免费视频 | 日韩成人影院在线观看 | 亚洲精品在线播放 | 黄色成人av | 亚洲精品久久视频 | 国产精品久久久久久久午夜片 | 精品无码久久久久久国产 | 日本精品一区二区三区在线观看视频 | 黄色欧美大片 | 日日日色| 羞羞视频在线观看 | 97成人精品 | 性国产xxxx乳高跟 | 午夜91| 亚洲欧美日韩精品久久亚洲区 | 91在线网站 | 午夜影院在线 | 国产高清在线 | 成人精品视频在线观看 | 国产精品久久久久久婷婷天堂 | 亚洲成人精品在线 | 区一区二在线观看 |