成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

詳解華為云基因容器服務(wù)GCS

企業(yè)動(dòng)態(tài)
華為云“有技術(shù)、有未來(lái)、值得信賴(lài)”,致力于做智能世界的黑土地,基于華為30年技術(shù)積累,華為云在容器和開(kāi)源領(lǐng)域持續(xù)深耕,也許就是其能夠成為重要貢獻(xiàn)者和領(lǐng)導(dǎo)者的重要原因之一。

基因測(cè)序,作為“下一個(gè)能夠改變世界”的技術(shù),已經(jīng)由實(shí)驗(yàn)室研究演變到臨床使用,為人類(lèi)預(yù)測(cè)罹患多種疾病的可能性,提前預(yù)防和治療疾病提供了一套可靠的方法和手段。而基于基因測(cè)序在預(yù)防和治療疾病方面的準(zhǔn)確和可靠,基因測(cè)序也因此成為了精準(zhǔn)醫(yī)療的基礎(chǔ)。據(jù)預(yù)測(cè),基因測(cè)序市場(chǎng)未來(lái)五年復(fù)合增長(zhǎng)率在35%左右,2022年有望突破300億美元。

基因測(cè)序的難題

然而,雖然基因測(cè)序市場(chǎng)火爆異常,但實(shí)際上,對(duì)于基因測(cè)序廠商來(lái)說(shuō),目前面臨著很多的困難和挑戰(zhàn),具體而言,最主要的就是成本高、效率低、門(mén)檻高。

成本高

所謂成本高,是指基因測(cè)序的基礎(chǔ)設(shè)施成本和運(yùn)營(yíng)成本高。不同于傳統(tǒng)的常規(guī)計(jì)算,基因計(jì)算,需要對(duì)海量的數(shù)據(jù)進(jìn)行非常復(fù)雜的計(jì)算。測(cè)算一個(gè)人的基因,就需要對(duì)30億對(duì)的DNA進(jìn)行測(cè)算,涉及的算法包括映射、過(guò)濾、去重、排列、索引、壓縮、重校驗(yàn)等等,以HiSeq X10測(cè)序儀產(chǎn)生的數(shù)據(jù)為例,一個(gè)人30x全基因組樣本數(shù)據(jù)FASTQ文件就會(huì)達(dá)到200GB ,中間數(shù)據(jù)sam文件大小將超過(guò)600GB。這無(wú)論對(duì)于服務(wù)器的計(jì)算還是存儲(chǔ)能力都提出了很高的要求,從而導(dǎo)致IT基礎(chǔ)設(shè)施成本居高不下。同時(shí),對(duì)這些IT基礎(chǔ)設(shè)施的維護(hù),也會(huì)帶來(lái)大量的運(yùn)維成本。

效率低

效率低首先是指計(jì)算的效率低,基因測(cè)序?qū)?huì)耗費(fèi)大量的時(shí)間,據(jù)悉,人類(lèi)歷史上的***次的基因測(cè)序耗費(fèi)了6個(gè)國(guó)家,10年的時(shí)間才最終完成,而即使在科技已經(jīng)日新月異的今天,如果采用傳統(tǒng)的IT架構(gòu)和計(jì)算框架,在基因數(shù)據(jù)的分析和解讀方面平均也會(huì)需要30+小時(shí),這是一個(gè)很低的計(jì)算效率。其次,是指資源利用率低。基因測(cè)序業(yè)務(wù)有明顯淡旺季之分,通常旺季業(yè)務(wù)是淡季的數(shù)倍,這種業(yè)務(wù)的極度不平衡性,也造成了IT基礎(chǔ)設(shè)施的平均利用率的低下。

門(mén)檻高

基因測(cè)序沒(méi)有統(tǒng)一標(biāo)準(zhǔn),生物信息數(shù)據(jù)處理流程復(fù)雜,軟件選擇多,流程差異大,此外,針對(duì)不同測(cè)序訴求,需要構(gòu)建不同的測(cè)序環(huán)境和流程,搭建過(guò)程復(fù)雜。因此,僅僅是軟件的部署和分發(fā),對(duì)于基因測(cè)序廠商中的IT部門(mén)就是一個(gè)不小的困難和挑戰(zhàn),更不用說(shuō)基因測(cè)序流程的設(shè)計(jì)和編排了。

針對(duì)基因測(cè)序領(lǐng)域的這些困難和挑戰(zhàn),華為云創(chuàng)造性的推出了以Kubernetes為基礎(chǔ)的基因容器服務(wù)GCS(Gene Container Service)。GCS將基因測(cè)序和容器技術(shù)***地結(jié)合在了一起,為廣大基因測(cè)序廠商提供了“更省、更快、更輕松”的云科學(xué)計(jì)算平臺(tái)。GCS是一個(gè)三層架構(gòu),***層是Docker層,這層主要解決基因測(cè)序相關(guān)軟件的安裝升級(jí)問(wèn)題,中間層是Kubernetes層,主要解決在多臺(tái)節(jié)點(diǎn)上安裝Docker,運(yùn)行Docker的問(wèn)題,最上層是流程管理層,主要負(fù)責(zé)基因測(cè)序的流程控制。

為什么會(huì)是容器

那么,為什么是Docker容器成為了華為云基因測(cè)序解決方案的***呢?這是因?yàn)?,首先,在基因測(cè)序領(lǐng)域,數(shù)據(jù)處理流程復(fù)雜,單步驟就存在多種軟件可選,單軟件也有多版本可選。而在傳統(tǒng)虛機(jī)中運(yùn)行基因測(cè)序相關(guān)軟件,不僅需要安裝多種軟件,還需要考慮軟件間版本兼容性,同一軟件多實(shí)例間競(jìng)爭(zhēng)影響等因素。這對(duì)于缺乏專(zhuān)業(yè)IT人才的基因測(cè)序企業(yè)來(lái)說(shuō),是一大痛苦。而容器技術(shù)具有使得不同軟件間運(yùn)行無(wú)感知的特性,同一個(gè)軟件任意多實(shí)例運(yùn)行也不會(huì)相互影響。而且Docker鏡像以軟件為單位, 獨(dú)立制作和更新都非常便捷,可以較好的克服多軟件多版本的安裝和配置問(wèn)題。

其次,在基因測(cè)序的過(guò)程中,如果前期調(diào)試流程出現(xiàn)錯(cuò)誤,將會(huì)導(dǎo)致軟件配置改變或者環(huán)境異常,這樣就必須重新搭建和恢復(fù)環(huán)境,同時(shí),軟件的分發(fā)和更新成本也很高。而通過(guò)Docker鏡像便捷分發(fā),一次構(gòu)建,隨處可運(yùn)行的機(jī)制,使得本地驗(yàn)證調(diào)試非常簡(jiǎn)便。環(huán)境的切換對(duì)Docker程序無(wú)影響,從而可以保證運(yùn)行環(huán)境的一致性以及數(shù)據(jù)處理結(jié)果的可重復(fù)性,而這對(duì)于解決基因測(cè)序的調(diào)試問(wèn)題有非常大的幫助。

***,按照傳統(tǒng)的基因測(cè)序方法,單樣本數(shù)據(jù)處理一般在單機(jī)上完成,所以目前普遍使用高規(guī)格機(jī)器來(lái)執(zhí)行pipeline流程。但這樣的話(huà),多機(jī)并發(fā)能力就會(huì)不足,如單獨(dú)開(kāi)發(fā)任務(wù)調(diào)度框架,門(mén)檻成本和收益也不明顯。同時(shí)單機(jī)上多任務(wù)并發(fā)能力也受限,無(wú)法很好的滿(mǎn)載利用計(jì)算資源。但如果采用容器技術(shù),單虛機(jī)上就可以同時(shí)運(yùn)行多個(gè)Docker容器,這使得多個(gè)任務(wù)可以同時(shí)在一個(gè)VM上執(zhí)行。再加上Kubernetes的資源調(diào)度能力,可以使得多任務(wù)按資源需求平均地在多VM上混合執(zhí)行,這樣,就會(huì)***化利用計(jì)算資源。

因此,有人說(shuō)基因測(cè)序與容器是注定天生的一對(duì),絕對(duì)不是夸大其詞。

基因測(cè)序利器

除了具有容器所帶來(lái)的天然優(yōu)勢(shì)之外,GCS還具有諸多適合基因測(cè)序領(lǐng)域的特點(diǎn),堪稱(chēng)基因測(cè)序領(lǐng)域***的利器。

便捷依賴(lài)定義&流程控制

GCS的流程描述語(yǔ)言非常靈活,結(jié)合容器的特點(diǎn),可以輕松執(zhí)行基因測(cè)序流程的遷移、拷貝,同時(shí),GCS還支持直接Shell方式的命令,因而,可以非常便捷的進(jìn)行基因測(cè)序流程的控制。

迭代式并發(fā)

針對(duì)基因測(cè)序領(lǐng)域高并發(fā)的要求,GCS通過(guò)便捷的迭代組合式并發(fā),可以輕松處理并發(fā)任務(wù)場(chǎng)景。例如,通過(guò)執(zhí)行變量迭代,一條“echo $(1) $(2)"命令可以迭代出3*2=6個(gè)并發(fā)操作。同時(shí),GCS的Shell語(yǔ)法,支持已有流程遷移,還支持用多種迭代描述方式,控制并發(fā)行為。

跨租戶(hù)共享存儲(chǔ)

GCS還支持跨租戶(hù)共享存儲(chǔ),平臺(tái)可以為用戶(hù)提供參考組,數(shù)據(jù)庫(kù)等公共數(shù)據(jù),并且這些數(shù)據(jù)還可以實(shí)現(xiàn)在各個(gè)租戶(hù)之間的共享,以便于不同用戶(hù)之間的協(xié)作。

親和性調(diào)度

通過(guò)GCS的親和調(diào)度功能,GCS可以把新任務(wù)優(yōu)先投遞到可容納的節(jié)點(diǎn),配合自動(dòng)擴(kuò)縮容,以達(dá)成最小的資源消耗。

集群自動(dòng)擴(kuò)縮容

GCS還具有集群自動(dòng)擴(kuò)縮容的能力,當(dāng)集群無(wú)法容納更多的新任務(wù)時(shí),系統(tǒng)會(huì)自動(dòng)新增節(jié)點(diǎn),當(dāng)節(jié)點(diǎn)長(zhǎng)期空閑時(shí),也會(huì)相應(yīng)的刪除節(jié)點(diǎn),從而既能使系統(tǒng)可以達(dá)到最小的資源消耗,又能輕松應(yīng)對(duì)業(yè)務(wù)峰值。同時(shí),由于容器運(yùn)行密度高,因此可以充分利用其計(jì)算能力,做到運(yùn)維零成本。

動(dòng)態(tài)并發(fā)

GCS具有動(dòng)態(tài)并發(fā)的功能,針對(duì)基因測(cè)序這樣復(fù)雜的任務(wù),可以根據(jù)實(shí)際情況,動(dòng)態(tài)的將復(fù)雜的任務(wù)切割成若干個(gè)簡(jiǎn)單的小任務(wù),分配到不同容器中去執(zhí)行,***再進(jìn)行合并,從而大大提升了系統(tǒng)應(yīng)對(duì)復(fù)雜業(yè)務(wù)流程的能力。

專(zhuān)業(yè)鏡像倉(cāng)庫(kù)

在基因測(cè)序領(lǐng)域,涉及的工具超過(guò)5000多個(gè),皆分布在DockerHub上,為此,GCS支持直接對(duì)接全球***的鏡像倉(cāng)庫(kù)DockerHub,還為用戶(hù)提供了華為SWR鏡像倉(cāng)庫(kù),并支持對(duì)接私有倉(cāng)庫(kù),這將大大方便基因測(cè)序領(lǐng)域的用戶(hù)使用這些工具。

GPU混合集群

特別的,GCS還支持GPU混合集群,除了支持GPU任務(wù)之外,還支持普通任務(wù)+GPU任務(wù)的混合調(diào)度,據(jù)了解,這是華為云GCS特有的功能,而且這項(xiàng)功能也會(huì)在華為CCE、CCI中得到應(yīng)用。

流程設(shè)計(jì)器

前面已經(jīng)說(shuō)過(guò),基因測(cè)序流程的設(shè)計(jì)復(fù)雜而枯燥,為此,GCS為用戶(hù)提供了圖形化的流程設(shè)計(jì)器,僅需通過(guò)鼠標(biāo)的拖拽就可以輕松完成基因測(cè)序流程的設(shè)計(jì),將基因測(cè)序人員從痛苦的流程設(shè)計(jì)過(guò)程中拉了出來(lái)。

多集群管理

GCS還具有強(qiáng)大的多集群管理功能,支持任務(wù)間資源隔離,可以輕松實(shí)現(xiàn)開(kāi)發(fā)環(huán)境和生產(chǎn)環(huán)境的隔離,同時(shí),在費(fèi)用管理上也更便捷。

除此之外,GCS還支持單群集多用戶(hù)的隔離,從集群到節(jié)點(diǎn)到任務(wù)的多維度監(jiān)控,并具有豐富的接口,很方便的就可以進(jìn)行集成。

而基于這些特點(diǎn),GCS可以確保最小資源消耗、充分利用計(jì)算能力,實(shí)現(xiàn)零成本運(yùn)維,并提供秒級(jí)擴(kuò)容,萬(wàn)級(jí)并發(fā)專(zhuān)屬集群,零排隊(duì)等待時(shí)間,可以使全基因組測(cè)序(WGS)耗時(shí)降低3-5倍,從而實(shí)現(xiàn)軟件免安裝,環(huán)境一鍵式重建、標(biāo)準(zhǔn)流程(WDL/SJM/Snakemake)快速遷移、千節(jié)點(diǎn)計(jì)算集群搭建由多天降低至半小時(shí)等。

不僅僅是GCS

而基于GCS,華為云還推出了KubeGene開(kāi)源項(xiàng)目,把基因容器最核心的部分開(kāi)源給廣大基因科學(xué)領(lǐng)域的企業(yè)和用戶(hù),不僅僅希望通過(guò)這種方式能夠直接幫助廣大基因科學(xué)的用戶(hù),也希望通過(guò)社區(qū)協(xié)作的方式來(lái)加速這個(gè)項(xiàng)目的發(fā)展,更好的促進(jìn)基因科學(xué)領(lǐng)域的廠商能夠更好的聚焦在自己的業(yè)務(wù)創(chuàng)新上。更希望廣大廠商和用戶(hù)能夠?qū)⒒驕y(cè)試的流程互相分享,互相借鑒、共同進(jìn)步,一起共建基因科學(xué)的容器生態(tài)。據(jù)華為云介紹,KubeGene項(xiàng)目自從11月中旬在上海KubeCon宣布以來(lái),在GitHub上已經(jīng)吸引到接近80多顆Star,接近20個(gè)Fork。

GCS僅僅是華為云在容器開(kāi)源領(lǐng)域貢獻(xiàn)的一個(gè)小小縮影,實(shí)際上,在容器開(kāi)源領(lǐng)域,華為一直是重要的貢獻(xiàn)者和容器生態(tài)的***,在Kubernetes社區(qū),華為貢獻(xiàn)國(guó)內(nèi)***,全球第三,在CNCF&Kubenetes 社區(qū),華為貢獻(xiàn)位列全球前四、國(guó)內(nèi)***,擁有Maintainer 12席,華為還是CNCF技術(shù)監(jiān)督委員會(huì)九位委員之一,K8S社區(qū)技術(shù)指導(dǎo)委員會(huì)十三位委員之一,也是首批KSCP認(rèn)證廠商。在OCI&Docker&其他社區(qū),華為貢獻(xiàn)全球前三、國(guó)內(nèi)***,擁有Maintainer 7席。華為還是OCI初創(chuàng)成員,容器鏡像格式的規(guī)范和實(shí)現(xiàn)的主導(dǎo)者,Kata Container項(xiàng)目發(fā)起者之一,架構(gòu)委員會(huì)5席位之一以及CNCF基金會(huì)的初創(chuàng)會(huì)員、白金會(huì)員和CNCF/Kubernetes TOC的成員。

華為云“有技術(shù)、有未來(lái)、值得信賴(lài)”,致力于做智能世界的黑土地,基于華為30年技術(shù)積累,華為云在容器和開(kāi)源領(lǐng)域持續(xù)深耕,也許就是其能夠成為重要貢獻(xiàn)者和***的重要原因之一。

 

責(zé)任編輯:張燕妮 來(lái)源: 51CTO
相關(guān)推薦

2018-12-14 11:28:31

基因測(cè)序

2018-10-18 11:41:33

華為

2018-11-19 15:14:36

華為云

2013-12-13 09:49:25

云計(jì)算華為云計(jì)算FusionCloud

2019-02-26 12:07:12

華為云

2012-08-31 10:25:50

云計(jì)算華為云服務(wù)

2017-10-31 14:36:26

華為

2018-07-06 11:23:53

華為云

2018-08-23 11:01:00

華為云

2018-02-24 10:48:15

華為云

2017-12-06 10:50:57

華為云

2012-05-28 18:09:11

華為云服務(wù)

2016-08-16 09:40:15

華為

2012-07-18 12:41:00

Office 15微軟

2015-06-18 13:19:39

云計(jì)算PaaS 容器

2018-01-24 11:05:38

華為云裸金屬服務(wù)器

2017-08-03 18:32:42

華為

2014-05-22 10:25:34

云計(jì)算大會(huì)華為

2019-03-26 15:53:08

華為云
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 国产精品成人国产乱一区 | 精品综合视频 | 国产福利二区 | 中文字幕在线免费 | 91精品久久 | 最新免费av网站 | 亚洲国产精品美女 | 中文字幕一区二区三区四区五区 | 春色av | 午夜精品久久久久久久 | 97国产精品 | 日韩电影一区 | 国产美女久久久 | 久久久久久久久91 | 91大神在线资源观看无广告 | 艹逼网| 超碰520| 久久国产亚洲 | 亚洲精品9999 | 久久成人精品视频 | 国产高清视频在线 | 亚洲欧美aⅴ | 久久久久精 | 国产精品久久久久久模特 | 国产精品不卡视频 | 一区二区三区在线观看免费视频 | 中文在线一区 | 美女天天干 | 亚洲福利在线观看 | 在线免费观看日本 | 丁香婷婷综合激情五月色 | 喷水毛片 | 国产三区精品 | 在线观看国产视频 | 欧美13videosex性极品 | 中文字幕在线播放第一页 | 免费午夜视频 | 日韩美女在线看免费观看 | 日韩精品一区二区三区在线观看 | 波多野结衣一区二区 | 欧美韩一区二区三区 |