成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Nature:哈佛&牛津開發最新AI模型,已預測3600萬個致命基因突變

新聞 人工智能
最近,來自哈佛醫學院和牛津大學的科學家合作開發了一種AI模型,成功預測了3219個疾病基因中超過3600萬個變體的致病性,并將超過25萬個未知變體進行了歸類。

[[432059]]

 本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

直接從基因層面預測疾病,這一直是近現代醫學研究的主要方向之一。

然而,全體人類的基因變異體數量遠超現有的探測技術,甚至僅僅是不同個體的蛋白質區編碼也會展現出巨大的差異性。

因此,超過98%的基因變異給人體帶來的影響依舊是未知且無法預測的。

但最近,來自哈佛醫學院和牛津大學的科學家合作開發了一種AI模型,成功預測了3219個疾病基因中超過3600萬個變體的致病性,并將超過25萬個未知變體進行了歸類。

Nature:哈佛&牛津開發最新AI模型,已預測3600萬個致命基因突變

這項研究現已登上Nature。

“從進化中預測致病性”

其實,現在臨床上已有用于預測基因變異影響的模型。

但這些模型往往是在經過標注的臨床數據集上進行有監督學習,一旦進入現實場景,標簽偏差、標簽稀疏以及噪音就會造成其準確率的下降,并不能作為基因變異體分類的可靠依據。

而這次的研究團隊提出了一個叫做EVE(Evolutionary model of Variant Effect)的模型。

這是一個僅根據進化序列訓練的無監督生成模型。

Nature:哈佛&牛津開發最新AI模型,已預測3600萬個致命基因突變

模型預測變異基因的致病性主要分為兩步:

第一步,使用變型自動編碼器VAE來學習蛋白質的氨基酸序列分布。

學習了多個領域的復雜高維分布之后,模型就捕捉到了進化過程中的自然序列約束,包括各種位置之間的復雜依賴關系。

再從得到的近似后驗分布(Approximate Posterior Distribution)中取樣,評估每個單一氨基酸變體相對于野生型的相對可能性。

這種相對可能性被稱為“進化指數”,與臨床標簽進行比較后發現,區分致病性和良性標簽的數值在不同的蛋白質中是一致的,這說明無監督的方法能夠有效推斷致病性。

Nature:哈佛&牛津開發最新AI模型,已預測3600萬個致命基因突變

第二步,在所有單一氨基酸變體的進化指數分布上擬合了一個雙組分(two-component)的全局-局部高斯混合模型。

Nature:哈佛&牛津開發最新AI模型,已預測3600萬個致命基因突變

這一步的輸出是在區間[0,1]內定義的連續致病性值,0代表良性,1代表致病性。

然后將EVE模型運用于ClinVar數據庫中的3219個人類基因上,得到的結果圖中的平均曲線面積(AUC)為0.91,說明EVE模型對絕大多數的基因變異都能做到具有臨床意義的預測:

Nature:哈佛&牛津開發最新AI模型,已預測3600萬個致命基因突變

優于已知模型,與實驗預測效果一致

研究團隊也將EVE模型與已知的模型進行了對比,可以看到,在預先確定已知的已標注臨床數據的預測上,其效果優于同類計算模型:

Nature:哈佛&牛津開發最新AI模型,已預測3600萬個致命基因突變

那么這樣一個AI計算模型與用于預測致病性的經典方法——深度突變掃描實驗(Deep Mutational Scan Experiment)相比效果又如何呢?

對比實驗后可以看到,EVE模型在臨床預測方面的總體表現與經典方法效果基本一致

Nature:哈佛&牛津開發最新AI模型,已預測3600萬個致命基因突變

而當從ClinVar數據庫中選擇一組數量規模更大,但高質量標注較小的數據時,EVE模型的表現甚至更好

Nature:哈佛&牛津開發最新AI模型,已預測3600萬個致命基因突變

哈佛&牛津合作出品

這篇論文有三位共同一作,其中Jonathan Frazer和Mafalda Dias都來自哈佛大學的系統生物學,他們同時也是Marks Group實驗室中的一員。

[[432060]]
[[432061]]

而Pascal Notin則是來自牛津大學的計算機科學專業的博士生,主要研究領域包括貝葉斯深度學習、生成模型、因果推理和計算生物學的交叉領域。

[[432062]]

論文鏈接:
https://www.nature.com/articles/s41586-021-04043-8

 

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-09-20 12:58:00

訓練研究

2018-09-27 17:20:25

2025-06-27 08:56:51

2024-01-19 16:50:34

大數據KRAS突變癌癥生物學

2015-12-09 15:21:25

基因突變大數據能量

2022-03-17 17:55:08

深度學習人工智能Nature

2024-05-23 09:28:23

模型蛋白質

2019-06-06 15:37:00

機器學習人工智能AI

2024-06-11 07:40:00

2025-03-31 09:30:00

數據訓練模型

2023-03-11 13:15:01

AI模型系統

2025-03-17 08:37:00

NatureAI模型

2023-09-20 09:49:41

2024-07-25 13:56:49

2024-07-29 07:04:00

大模型AI訓AI人工智能

2024-07-29 08:00:00

模型論文

2017-12-25 11:16:34

基因測試癌癥

2024-11-11 10:00:00

ChatGPT模型

2022-12-21 17:23:08

2022-02-22 10:40:27

漏洞網絡攻擊
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: av电影一区二区 | 热re99久久精品国99热观看 | 国产精品久久久久久久久久久新郎 | 久久精品国产久精国产 | 国产日韩欧美 | 九九热精| 欧美影院| 日本字幕在线观看 | 国产精品美女久久久 | 国偷自产av一区二区三区 | 亚洲成人精品视频 | 久久亚洲一区 | 日本一道本 | 久久免费精彩视频 | 亚洲色图综合网 | www.国产一区 | 成人免费黄视频 | 午夜精品久久久久久久久久久久久 | 久久综合狠狠综合久久综合88 | 性做久久久久久免费观看欧美 | 国产精品自拍av | 日日夜夜天天 | 一区二区三区精品视频 | 色一级片 | 国产男人的天堂 | 国产精品一区久久久 | 欧美aⅴ片 | av无遮挡 | 91免费在线| 亚洲精品第一页 | 综合九九 | 日本高清在线一区 | 在线看av的网址 | 自拍视频网 | 在线视频日韩 | 伊人伊人 | 亚洲一区导航 | 二区视频| 97久久精品午夜一区二区 | 免费国产黄网站在线观看视频 | 久久av资源网 |