共同抗“疫” AWS加速新冠病毒的藥物篩選
原創【51CTO.com原創稿件】 庚子年初,新型冠狀病毒來襲,打亂了人們的工作和生活。除了“逆勢前行”的醫務工作者以外,還有更多的科研機構人員對病毒進行分析,篩選潛在藥物和研發疫苗。上海交通大學陳海峰課題組便是其中的一員。
在新型冠狀病毒疫情爆發時,陳教授課題組積極開展研究的準備工作,在對新型冠狀病毒潛在藥物篩選工作時,利用AWS的CPU實例快速搭建虛擬藥物篩選流程,通過GPU實例搭建分子動力學模擬分析流程,從而找到有效的藥物分子的成藥可能性。
藥物發現涉及多個階段 并非易事
陳海峰課題組是隸屬于上海交通大學生命科學技術學院生物信息學與生物統計學系和微生物代謝國家重點實驗室的研究團隊,其團隊主要研究方向為虛擬藥物篩選,分為兩大方向,一是天然無規蛋白的精準分子力場研究,二是通過計算機輔助創新藥物設計,找到藥物和靶標蛋白之間的匹配關系,從而找到治療某種特定疾病的相關藥物。
上海交通大學陳海峰課題組
新型冠狀病毒出現后,很多醫療機構和科研機構都在積極的找到應對病毒的藥物,然而,新型病毒出現后,是需要多個階段才能完成最終的藥物發現,這并非易事。陳海峰教授介紹道:一個新的病毒出來后,首先我們將病毒株分離;分離后對病毒進行基因測序;測序完成后,對病毒基因組的序列進行分析,找到重要的能夠編碼蛋白的基因,也就是關鍵性蛋白;下一步,通過X射線衍射或者冷凍電鏡的方法,測定病毒蛋白的三維結構,作為藥物篩選的靶標;而后,可以利用計算生物學的方法評估哪些小分子化合物能夠和已知蛋白靶標很好的結合;有了虛擬篩選結果后,通過特定方法,例如細胞實驗,驗證其是否能夠抑制病毒;接下來就是臨床試驗,通過動物模型,驗證藥物有效性;然后是人體的三期臨床試驗,評估藥物的安全性、治病效果以及大批量試驗確定藥物的劑型劑量。
陳海峰教授表示,天然無規蛋白是一類在生理條件下沒有穩定三級結構的蛋白質,這類蛋白在真核生物蛋白質組中的含量超過40%,與腫瘤、心血管疾病、神經退行性疾病以及糖尿病等復雜疾病的發生發展密切相關。由于它們很難結晶,現有試驗方法很難測定它們的結構。于是計算機生物學的方法就成為研究這類蛋白的一種重要方法。為了研究這類蛋白,我們就開發了相關分子力場,即在ff03分子力場的基礎上,通過添加基于格點的能量矯正項,發展了一種平衡而高效的分子力場ff03CMAP,該力場受到國際國內同行的廣泛關注。
如何短期獲取高效研究成果 云成為可能
在新型冠狀肺炎疫情期間,陳海峰課題組也進行了相關研究,通過計算機輔助篩選哪些藥物分子可能與新型冠狀病毒的關鍵蛋白結合,讓病毒的生命周期終止,從而抑制病毒蔓延。
要想篩選藥物分子,需要知道病毒的關鍵蛋白。在饒子和院士課題組發布了新型冠狀病毒蛋白的晶體結構后陳海峰課題組在第一時間(1月27日)申請進行抗病毒藥物的虛擬篩選研究。
但是,人類對新型冠狀病毒的了解還非常有限,需要進行大量的計算研究,而且時間不等人,越是快速研究出成果,越可以早日打贏這場攻堅戰。陳海峰教授表示,新型冠狀病毒在全世界大流行,越早獲得相關信息,找到可能的命中結果,就可以越早的結束這場疫情。
但是藥物的篩選過程非常復雜,需要大量的計算資源來輔助完成。陳海峰教授告訴51CTO,傳統的方法是用過本地服務器來進行研究,而且,通常需要很長時間才會有結果。此外,由于課題經費有限,計算資源不能無限擴展,要想在短時間獲得更高效的結果,云計算提供了一種可能性。
陳海峰教授
在全球疫情爆發之時,亞馬遜在全球推出了“AWS診斷開發計劃”,是AWS針對新型冠狀疫情成立的專項研究基金,為研究機構和商業藥物研究組織提供包括云計算資源和技術方面的支持。當得知AWS診斷開發計劃后,陳海峰教授課題組欣然加入,雙方一拍即合。
CPU+GPU 加速藥物篩選進程
據陳海峰教授的學生劉灝介紹,過去,課題組在本地有兩臺服務器,裝有8張GPU運算卡。但是隨著時間更迭以及技術的快速發展,實驗室的NVIDIA Tesla K20 或K10的GPU運算卡計算效率以及性能都相對降低。于是,課題組采用了AWS中國(寧夏)區域的計算資源展開研究。
課題組通過采用 Amazon EC2實例(c5.9xlarge,第5代計算優化型實例),完成藥物的虛擬篩選工作。在得到新型冠狀病毒的S蛋白結構后,課題組通過分子對接的方法篩選親和力(藥物分子與蛋白的相互作用),評估有可能的藥物小分子。通過AWS的計算實例,僅用2天時間就完成了五個藥物分子庫的篩選,獲得了14個具有潛在抗毒性的分子。
在藥物小分子篩選完成后,需要通過GPU平臺進行分子動力學模擬,來驗證藥物與病毒蛋白之間的作用,這就利用了Amazon EC2實例(p3.8xlarge,第三代GPU實例,內含8個GPU,支持NVlink)。課題組搭建了GPU加速的分子動力學模擬分析流程,選擇了虛擬篩選結果最優的4個藥物分子進行第一批的模擬分析,僅用1周的時間(本地服務器一般需要20-30天)就拿到了初步模擬的結果,隨后又提交了第二批篩選藥物分子進行模擬,得到了很好的分子模擬結果,證明了這些藥物分子的成藥可能性。
來自巴基斯坦的留學生Ashfaq Ur Rehman分享了課題組使用AWS的體會。首先,AWS的速度確實比本地的服務器快很多,在虛擬藥物篩選速度方面提升了5倍,在分子動力學模擬過程中的速度平均提升4倍。第二,AWS平臺是易用的。過去在研究時,我們需要連接本地服務器,效率較低,而且現在的環境也不能回到實驗室。AWS提供的平臺可以方便地連接到云端進行快速分析,登陸云端服務器后的操作使用與本地環境沒有太大區別,幫助我們提高了篩選效率。第三,AWS是非常安全的。過去本地服務器是有多個課題組共用的,數據安全得不到有效保障,而AWS擁有隔離的網絡環境,讓我們安心地進行科研研究。
未來
目前,我國的新型冠狀病毒疫情得到有效控制,但是對抗病毒之路還需砥礪前行。陳海峰課題組也會繼續深耕,篩選研究出更多可以應對病毒的藥物。陳海峰教授表示,未來會通過人工智能技術來設計更高效的分子力場,更加高效的評估藥物分子或蛋白之間的相互作用,加快藥物篩選進度;同時,會加大云端的資源和算力,更長時間評估藥物分子與蛋白的結合情況,提高研發效率。
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】