成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI助力繪制生物多樣性圖改善藥物發(fā)現(xiàn)

人工智能
當(dāng)涉及到對(duì)過(guò)去40億年來(lái)地球上進(jìn)化的所有蛋白質(zhì)和酶進(jìn)行編目時(shí),人類知識(shí)幾乎沒(méi)有觸及表面。這就是為什么一家名為Basecamp Research的公司正在將圖形和人工智能技術(shù)結(jié)合起來(lái),以擴(kuò)大人類知識(shí)的范圍并加速藥物發(fā)現(xiàn)。

當(dāng)涉及到對(duì)過(guò)去40億年來(lái)地球上進(jìn)化的所有蛋白質(zhì)和酶進(jìn)行編目時(shí),人類知識(shí)幾乎沒(méi)有觸及表面。這就是為什么一家名為Basecamp Research的公司正在將圖形和人工智能技術(shù)結(jié)合起來(lái),以擴(kuò)大人類知識(shí)的范圍并加速藥物發(fā)現(xiàn)。

Basecamp Research由Glen Gowers和Oliver Vince于2019年創(chuàng)立,旨在加速藥物研究中數(shù)據(jù)驅(qū)動(dòng)的突破。兩位牛津大學(xué)博士生物學(xué)家對(duì)將環(huán)境數(shù)據(jù)引入實(shí)驗(yàn)室以促進(jìn)藥物發(fā)現(xiàn)方面缺乏進(jìn)展感到沮喪,因此他們決定成立一家公司來(lái)解決這個(gè)問(wèn)題。

這家英國(guó)私營(yíng)公司努力的核心是一個(gè)知識(shí)圖譜,旨在作為自然世界的數(shù)字孿生。BaseGraph運(yùn)行在Neo4j圖形數(shù)據(jù)庫(kù)上,包含55億個(gè)生物關(guān)系,是世界上最大的此類數(shù)據(jù)庫(kù)。該公司表示,它收集的數(shù)據(jù)比所有可比的公共數(shù)據(jù)庫(kù)多10倍,并對(duì)其進(jìn)行了結(jié)構(gòu)化,以最大限度地利用其中的背景、多樣性和生物信號(hào)。

Neo4j的首席技術(shù)官Philip Rathle表示,許多制藥公司都使用Neo4j進(jìn)行藥物發(fā)現(xiàn)。但BaseGraph的獨(dú)特之處在于,它還記錄了它們存在的環(huán)境條件,如溫度、濕度、土壤化學(xué)、pH值、土壤礦物質(zhì)含量等,這對(duì)于理解酶、蛋白質(zhì)和完整的生物體至關(guān)重要。

Rathle說(shuō):“據(jù)我所知,他們是唯一認(rèn)識(shí)到地球上所有生命中只有一小部分(比如0.01%)被編目的方式可用于發(fā)現(xiàn)新藥的人。”“他們正在將生態(tài)系統(tǒng)中的數(shù)據(jù)放入一個(gè)圖表中,將其與微生物學(xué)聯(lián)系起來(lái),然后他們的客戶——從事藥物開(kāi)發(fā)的公司——利用這些信息更快地開(kāi)發(fā)出更好的藥物。”

環(huán)境數(shù)據(jù)

環(huán)境數(shù)據(jù)對(duì)于充分了解蛋白質(zhì)和酶在不同環(huán)境中的行為以及最終它們對(duì)藥物開(kāi)發(fā)的價(jià)值至關(guān)重要。

例如,Rathle說(shuō),如果實(shí)驗(yàn)室環(huán)境中的ph值相對(duì)于自然環(huán)境下降了1%,它可能會(huì)導(dǎo)致蛋白質(zhì)以完全不同的方式表現(xiàn)。例如,鐵的存在可以區(qū)分生物相互作用是否發(fā)生。

為了收集這些數(shù)據(jù),Basecamp Research與第三方科學(xué)家合作,他們進(jìn)入現(xiàn)場(chǎng)收集這些數(shù)據(jù)。他們收集的數(shù)據(jù)來(lái)自全球一些最偏遠(yuǎn)的地方,如亞馬遜雨林和南極洲的冰凍沙漠(該公司的名字Basecamp來(lái)自Goers和Vince在冰蓋上生活時(shí)進(jìn)行的DNA測(cè)序?qū)嵉乜疾欤?/span>

當(dāng)Basecamp從一些數(shù)據(jù)中獲利時(shí),該公司已承諾將部分收益交給國(guó)家公園和其他保護(hù)土地的實(shí)體。該公司表示,確保其現(xiàn)場(chǎng)供應(yīng)鏈數(shù)據(jù)的完整性至關(guān)重要,維護(hù)地球上酶、蛋白質(zhì)和生物生存和進(jìn)化的野生環(huán)境也是如此。

55億邊緣和計(jì)數(shù)

BaseGraph包含三種類型的數(shù)據(jù),包括:環(huán)境、地質(zhì)和化學(xué)數(shù)據(jù);微生態(tài)學(xué)、宏基因組學(xué)和基因組學(xué);以及深度學(xué)習(xí)衍生的功能和結(jié)構(gòu)蛋白質(zhì)特征。

所有這些數(shù)據(jù)都加載到BaseGraph中,BaseGraph擁有55億個(gè)生物關(guān)系,已經(jīng)是世界上最大的生物數(shù)據(jù)圖。該公司表示,隨著新數(shù)據(jù)的出現(xiàn),它正以每四周5億個(gè)新數(shù)據(jù)的速度擴(kuò)張。

在BaseCamp經(jīng)過(guò)一段時(shí)間的技術(shù)探索后,決定使用圖形數(shù)據(jù)庫(kù)。根據(jù)Neo4j在YouTube上發(fā)布的一份演示文稿,Basecamp Research的數(shù)據(jù)工程團(tuán)隊(duì)負(fù)責(zé)人Saif Ur-Rehman說(shuō):“我的第一反應(yīng)是‘把所有東西都放在表格里,然后加入’。”

然而,他們很快就遇到了標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)技術(shù)的極限。Basecamp的首席技術(shù)官Phil Lorenz在Neo4j網(wǎng)站上的一篇報(bào)道中說(shuō):“生命是一個(gè)網(wǎng)絡(luò),而不是一個(gè)列表。”

在選擇了Neo4j(市場(chǎng)上使用最頻繁、最完善的圖形數(shù)據(jù)庫(kù)之一)后,Basecamp Research團(tuán)隊(duì)開(kāi)始對(duì)他們的數(shù)據(jù)進(jìn)行建模。他們使用通過(guò)Neo4j圖形數(shù)據(jù)科學(xué)(GDS)庫(kù)提供的圖形嵌入來(lái)表示蛋白質(zhì)“不僅通過(guò)它們的序列,而且結(jié)合了基本的上下文信息,可以顯示這些蛋白質(zhì)將如何相互作用、行為和最終表現(xiàn),”Neo4j在其報(bào)告中說(shuō)。

Basecamp客戶可以通過(guò)這種方式存儲(chǔ)連接數(shù)據(jù),查詢圖表并發(fā)現(xiàn)隱藏的關(guān)系,該公司稱之為“微生物暗物質(zhì)”,指的是未被探索的微生物的廣闊空間。

輸入AI

這已經(jīng)帶來(lái)了回報(bào)。根據(jù)Neo4j的說(shuō)法,研究人員發(fā)現(xiàn)了30倍以上的大絲氨酸重組酶(LSR),這為通過(guò)基因編輯創(chuàng)造新療法開(kāi)辟了潛力。

另一個(gè)成功來(lái)自化學(xué)制造業(yè),一家價(jià)值160億美元的公司能夠利用Neo4j圖算法和BaseGraph在短短一個(gè)月內(nèi)優(yōu)化一種特定的酶,這是該公司兩年前進(jìn)行的工作。

Basecamp Research還將人工智能技術(shù)與圖形數(shù)據(jù)庫(kù)相結(jié)合,以推動(dòng)更多的發(fā)現(xiàn)。它正在使用圖形數(shù)據(jù)庫(kù)中建立的已知交互來(lái)訓(xùn)練大型語(yǔ)言模型(LLM),這使其能夠生成藥物開(kāi)發(fā)的潛在候選者。

該公司發(fā)表了一篇關(guān)于ZymCTRL或酶控制的論文,這是一種基于酶序列訓(xùn)練的模型,可以根據(jù)用戶需求產(chǎn)生活性酶。它還發(fā)表了關(guān)于大型復(fù)雜蛋白質(zhì)結(jié)構(gòu)模型BaseFold和蛋白質(zhì)功能模型HiFi NN的論文。

在《GEN生物技術(shù)》雜志上,Vince、Gowers和Sian McGibbon寫道,Basecamp Research已經(jīng)開(kāi)始采用一種新模型,該模型能夠在不損害倫理的情況下,從自然界中持續(xù)生成研究所需的數(shù)據(jù)。

他們寫道:“人工智能在生物技術(shù)中的出現(xiàn)為該行業(yè)帶來(lái)了分水嶺時(shí)刻。”“高質(zhì)量訓(xùn)練數(shù)據(jù)的有限可用性已經(jīng)減緩了創(chuàng)新的步伐。生物技術(shù)中新興的大數(shù)據(jù)時(shí)代為生物經(jīng)濟(jì)中利益相關(guān)者的商業(yè)利益、發(fā)展目標(biāo)和可持續(xù)發(fā)展目標(biāo)提供了一個(gè)自然的機(jī)會(huì)。只有發(fā)展基于可持續(xù)伙伴關(guān)系的數(shù)據(jù)供應(yīng)鏈,積極與生物多樣性提供者協(xié)調(diào)激勵(lì)措施并分享利益,才能滿足對(duì)大量高質(zhì)量遺傳數(shù)據(jù)用于訓(xùn)練大型模型的日益增長(zhǎng)的需求。”

責(zé)任編輯:華軒 來(lái)源: Ai時(shí)代前沿
相關(guān)推薦

2020-08-11 23:19:08

人工智能生物多樣性A

2020-11-04 10:29:42

數(shù)據(jù)分析工作多樣性大數(shù)據(jù)

2009-12-22 09:56:36

2022-05-29 07:31:14

加密密碼數(shù)據(jù)安全

2013-08-22 13:44:30

Linux桌面GNOME桌面

2024-06-24 15:57:40

2014-04-16 13:24:42

2021-04-26 09:41:41

數(shù)字化

2015-07-13 13:35:01

2020-03-12 10:24:37

大數(shù)據(jù)技術(shù)人工智能

2021-10-23 22:48:19

華為HPC

2020-07-15 07:33:18

物聯(lián)網(wǎng)大數(shù)據(jù)IOT

2017-03-16 13:28:25

VR人工智能 API

2022-04-28 19:43:05

計(jì)算

2020-12-16 08:20:59

數(shù)據(jù)多樣性數(shù)據(jù)大數(shù)據(jù)

2015-08-17 09:28:44

2019-09-26 16:29:29

華為

2020-03-09 20:52:43

數(shù)據(jù)多模型數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 日韩欧美在线免费观看 | 日韩电影中文字幕 | 福利影院在线看 | 麻豆a级片 | 91精品入口蜜桃 | 日日噜噜噜夜夜爽爽狠狠视频, | 欧美精品国产一区二区 | 韩日一区二区三区 | 久久lu | 亚洲福利 | 天天干天天草 | 中文字幕在线观看国产 | 91精品国产色综合久久不卡98口 | 日韩福利片 | 婷婷色在线 | 国产美女永久免费无遮挡 | 高清一区二区三区 | 一区二区视频 | 亚洲一区精品视频 | 国产精品久久久久久亚洲调教 | 亚洲国产成人久久综合一区,久久久国产99 | 午夜综合 | 国产欧美一区二区三区日本久久久 | 国产精品亚洲欧美日韩一区在线 | 91久久精品一区二区二区 | 黄网站色大毛片 | 日韩精品视频一区二区三区 | 午夜激情国产 | 91原创视频在线观看 | 影音先锋成人资源 | 一区中文 | 国产一区二区三区四区在线观看 | 亚洲第一成人影院 | av网站免费在线观看 | 中文字幕在线观看一区二区 | 精品久久99 | 亚洲国产精品久久人人爱 | 中文字幕日韩欧美一区二区三区 | 在线观看特色大片免费网站 | 一区二区在线免费播放 | 日韩精品免费在线观看 |