成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Platform助力上海超算提高集群使用率

云計算
自上海超算中心二期工程實施以來,Platform就積極參與到高性能計算集群系統(tǒng)建設(shè)中來,為上海超算中心的高性能計算集群系統(tǒng)的正常運作提供強有力的支持。

作為一個城市現(xiàn)代化發(fā)展水平的重要標志,公共計算平臺能夠讓更多的人力資源、資金、技術(shù)快速流動起來,在帶來巨大的經(jīng)濟效益和社會效益的同時,推動著高新技術(shù)產(chǎn)業(yè)以及企業(yè)自主創(chuàng)新的發(fā)展,具有深遠意義。

上海超級計算中心(SSC)由上海市政府投資建設(shè),累計總投資規(guī)模5億元人民幣以上,坐落于上海市張江高科技園區(qū)。多年來,上海超級計算中心立足上海,面向全國,為來自工程科研院所和多所知名大學(xué)的超過350家用戶,提供了隨需應(yīng)變的高性能計算資源、技術(shù)支持以及高級技術(shù)咨詢服務(wù),支持了一大批國家和地方政府的重大科學(xué)研究、工程和企業(yè)新產(chǎn)品研發(fā),在汽車、航空、鋼鐵、核能、市政工程、新材料、生物制藥、天文、物理、化學(xué)等多個領(lǐng)域取得了大批重大成果。

挑戰(zhàn):數(shù)百萬億次計算規(guī)模 作業(yè)調(diào)度系統(tǒng)面臨挑戰(zhàn)

上海超算中心目前擁有曙光4000A(2004年世界排名第十)和“魔方”(曙光5000A,2008年世界排名第十、亞洲第一)等多臺超級計算機,同時配備豐富的科學(xué)計算和工程計算軟件。
上海超算中心主機系統(tǒng)分三期工程進行建設(shè),其中,二期工程部署了曙光4000A超級計算機系統(tǒng),共有512個計算節(jié)點,每個節(jié)點4個CPU,于2004年底投入運行。三期工程部署了魔方(曙光5000A)超級計算機,于2009年6月投入運行,共有1500多臺計算節(jié)點,2.5萬多個核。在魔方(曙光5000A)上運行超過了40種以上的各類商用應(yīng)用軟件和上百種的科學(xué)研究程序。
上海超算中心高性能計算集群系統(tǒng)三期主機的處理能力為二期主機的20倍,CPU個數(shù)為二期主機的10倍以上,系統(tǒng)每天運行的作業(yè)數(shù)、訪問用戶數(shù)及作業(yè)類型等也成比例增長,因此系統(tǒng)運行的復(fù)雜度呈成倍增長態(tài)勢,這對主機系統(tǒng)管理和運行的核心軟件——作業(yè)調(diào)度系統(tǒng)提出了更高、更嚴的要求。

同時,上海超算中心高性能計算集群平臺的應(yīng)用環(huán)境非常復(fù)雜,其應(yīng)用領(lǐng)域遍及基礎(chǔ)科學(xué)研究(包括計算化學(xué)、高能物理、地球物理、天體物理、 新材料研究、生物醫(yī)藥、基因研究、人工智能等);社會公益事業(yè)(包括數(shù)值氣象預(yù)報、環(huán)境保護、地震預(yù)報);工業(yè)與工程計算(包括航空航天、船舶和海洋工程、汽車設(shè)計、地質(zhì)勘探、建筑工程、核電工程、電子與通訊、裝備制造);數(shù)據(jù)處理(包括金融、政務(wù)、商務(wù)、證券、交通)等多個領(lǐng)域,這就要求高性能計算集群平臺的作業(yè)調(diào)度系統(tǒng)必須能對各個應(yīng)用軟件具有非常良好的支持,不僅能支持各種工程計算應(yīng)用,還能支持各種各樣基礎(chǔ)科學(xué)研究。這意味著作業(yè)調(diào)度系統(tǒng)要與各個商業(yè)應(yīng)用軟件具有良好的接口和后臺支撐,同時還必須支持各種開源軟件,確保各種應(yīng)用軟件在集群環(huán)境下的穩(wěn)定應(yīng)用。

解決方案:Platform LSF挺身而出 難題不再

自上海超算中心二期工程實施以來,Platform就積極參與到高性能計算集群系統(tǒng)建設(shè)中來,為上海超算中心的高性能計算集群系統(tǒng)的正常運作提供強有力的支持。

Platform為上海超算中心高性能計算集群系統(tǒng)三期工程提供的Platform 作業(yè)調(diào)度系統(tǒng)(Platform LSF HPC)解決方案拓撲圖如下圖所示。在訪問網(wǎng)絡(luò)層,提供用戶使用高性能平臺的通道,通過登錄節(jié)點作為統(tǒng)一接口訪問高性能服務(wù),同時,將用戶與高性能后臺系統(tǒng)隔離,提高安全性和可管理性。在管理網(wǎng)絡(luò)層,提供對高性能平臺進行部署、監(jiān)控、調(diào)度和管理通信平臺,保證系統(tǒng)可控性和可管理性。在計算網(wǎng)絡(luò)層,提供高性能應(yīng)用、并行計算應(yīng)用之間數(shù)據(jù)通信,減少延遲和增大帶寬,保證高性能計算應(yīng)用的高效率和高質(zhì)量。在存儲網(wǎng)絡(luò)層,提供存儲服務(wù)器與存儲設(shè)備高IO吞吐和高流量通訊訪問,保證系統(tǒng)對存儲利用的高并發(fā)和大吞吐。當(dāng)然,其他節(jié)點對存儲訪問不僅依賴存儲網(wǎng)絡(luò),同時還將依賴IO服務(wù)器與其他服務(wù)器之間的管理網(wǎng)絡(luò)或計算網(wǎng)絡(luò)(取決于IO服務(wù)器使用管理網(wǎng)絡(luò)還是計算網(wǎng)絡(luò)提供IO服務(wù))。

Platform作業(yè)調(diào)度系統(tǒng)(Platform LSF HPC)的核心是Platform LSF。LSF是業(yè)界領(lǐng)先的最為廣泛使用的分布式批處理中間件,它可以用于提供PaaS服務(wù), 并支持網(wǎng)格化SaaS。在電子設(shè)計、航空航天、汽車、生命科學(xué)、政府、教育、科研、石油等各個領(lǐng)域獲得了廣泛應(yīng)用,包括德州儀器(TI)、AMD、通用汽車、戴姆勒克萊斯勒、波音、聯(lián)合技術(shù)等著名公司均采用LSF對其高性能計算平臺進行管理和調(diào)度。

LSF在可靠性、響應(yīng)時間、可操作性、可維護性等方面有較大的優(yōu)勢,表現(xiàn)在:

高可靠性。隨著機群系統(tǒng)的逐步擴大,依賴于機群系統(tǒng)的人越來越多,機群系統(tǒng)的故障將導(dǎo)致數(shù)百、乃至數(shù)千分布世界各地的員工工作受到影響,甚至直接影響到產(chǎn)品的測試、驗證乃至發(fā)布。LSF具有高可靠性,其機群系統(tǒng)的平均無故障時間大于99.95%,即一個季度,停機時間小于一個小時。LSF的高可靠性已經(jīng)在TI,AMD,NVIDIA等超大規(guī)模機群的運營中得到證明。

100%可信賴的作業(yè)調(diào)度和管理。LSF提供的透明遠程執(zhí)行機制以及通過JobStarter提供的作業(yè)運行環(huán)境自適應(yīng)機制可以確保作業(yè)調(diào)度和運行的正確性。TI、 AMD、NVIDIA、GM等作業(yè)調(diào)度系統(tǒng)運營表明,在不考慮用戶因素和操作系統(tǒng)等其它因素的情況下,其作業(yè)調(diào)度系統(tǒng)確保作業(yè)運行的正確性為99.99%以上。

高可擴展性。Platform LSF單一機群管理的CPU數(shù)已經(jīng)向10,000 ~ 20,000等更多CPU方向展。目前在TI, AMD, NVIDIA等企業(yè)單個機群最大CPU數(shù)均超過計10000個,節(jié)點數(shù)在4、5000臺以上。

良好的可操作性,支持在線修改。Platform LSF支持在線修改,支持系統(tǒng)管理員根據(jù)用戶需求的變化,動態(tài)地修改系統(tǒng)配置,不影響作業(yè)的運行和用戶的使用。

良好的可維護性。Platform LSF支持機群系統(tǒng)的在線升級和維護。系統(tǒng)管理員可以在不影響作業(yè)的運行和用戶使用的情況下,替換新的系統(tǒng)服務(wù)程序,進行系統(tǒng)在線升級和維護。

效果:實現(xiàn)負載均衡 管理更便捷

Platform 作業(yè)調(diào)度系統(tǒng)很好地幫助上海超算解決了大型、復(fù)雜作業(yè)的調(diào)度,保證了整個集群的負載平衡,提高了作業(yè)運行效率,大大降低了作業(yè)運行的成本。表現(xiàn)在以下幾個方面:

保證了負載均衡,讓每臺機器都參與運算,提高了整個集群的使用率。作業(yè)提交后,可以很均衡的提交到集群中的上千個計算節(jié)點上,讓上萬個核都參與運算,而不是每次都是一部分機器參與運算。

作業(yè)的運行時間大大降低,降低了運行成本,從而提高了系統(tǒng)的吞吐量。例如一個運行10小時的FLUENT的作業(yè),利用LSF調(diào)度后,一般可以將時間縮短到8小時,甚至5小時,效率提高了20%~50%。

管理方便。LSF已經(jīng)將2000多臺計算節(jié)點分三個邏輯分區(qū)進行了合理的管理,管理員可以很容易地對每個邏輯分區(qū)的每個計算節(jié)點進行實時查詢和監(jiān)控。

操作方便。LSF已經(jīng)集成了40多個應(yīng)用軟件,上海超算的客戶可以很容易的提交他們的作業(yè)、數(shù)據(jù)的上傳和下載,并對作業(yè)進行實時監(jiān)控。

上海超算中心魏玉琪經(jīng)理認為,Platform LSF是個很優(yōu)秀的集群調(diào)度軟件,LSF很好的幫助上海超算解決了大型、復(fù)雜作業(yè)的調(diào)度,保證了整個集群的負載平衡,讓2萬多個核都參與運算,提高了作業(yè)運行效率,大大降低了作業(yè)運行的成本。現(xiàn)在上海超算中心的高性能計算集群系統(tǒng)保持著滿負荷運行,每天有上千個作業(yè)吞吐量,LSF能很好的將用戶作業(yè)進行調(diào)度,并保證了作業(yè)運行的穩(wěn)定性、安全性,而且查詢也非常方便,能實時地對作業(yè)進行監(jiān)控。Platform幫助上海超算中心將各種應(yīng)用軟件集成到了LSF中,方便了中心的用戶提交作業(yè)。他表示,未來,上海超級計算中心將進一步提升技術(shù)能力和服務(wù)水平,協(xié)助更多的用戶將先進計算能力轉(zhuǎn)化為科研創(chuàng)新能力,打造國際一流的超級計算中心。

責(zé)任編輯:小明 來源: 51CTO.com
相關(guān)推薦

2010-08-19 14:49:11

使用率魔方

2012-05-30 16:32:34

谷歌瀏覽器IE

2022-08-02 13:28:24

商業(yè)智能功能自助服務(wù)

2019-05-17 11:14:18

超算中心英特爾智能制造

2024-04-11 13:27:19

Linuxtop命令

2011-04-06 11:36:30

MRTG監(jiān)控內(nèi)存

2015-04-27 09:29:48

微軟AzureIaaS混合IT

2009-11-16 17:03:20

Oracle優(yōu)化CPU

2019-01-15 15:04:54

CPU電腦使用率

2023-10-26 19:10:11

Java

2013-05-10 10:03:09

開源項目開源使用率集成商

2009-12-31 17:55:33

浪潮天梭刀片

2012-05-08 15:04:12

Platform

2009-01-13 16:41:02

編程語言JavaC

2021-08-10 11:45:57

topCPULinux

2024-05-14 08:47:01

JavaPAC++

2021-05-31 15:53:57

CPU Top命令

2022-07-23 21:31:24

KubernetesLinux開源

2022-02-09 16:35:48

GoogleChrome 瀏覽器Android 12
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: www97影院| 亚洲精品一区二区网址 | 国产日韩视频 | 麻豆毛片 | 一区二区国产精品 | 男女啪啪高潮无遮挡免费动态 | 亚洲国产中文字幕 | 欧美一区精品 | 91久久 | 国内精品久久精品 | 免费看的黄网站 | 国产免费又黄又爽又刺激蜜月al | 日本在线小视频 | 天堂资源 | 成人国产在线视频 | 福利久久 | 国产极品91 | 97起碰| www.久久国产精品 | 国产中文 | 综合久久99| 成人午夜免费网站 | 亚洲v日韩v综合v精品v | 伊人网在线综合 | 日韩在线视频一区 | 91在线播 | 国产欧美日韩一区 | 欧美成人第一页 | 欧美一级在线观看 | 四虎成人av | 97国产精品 | 亚洲成人播放器 | 成人亚洲性情网站www在线观看 | 最新日韩在线 | 久久国内| 大香在线伊779 | 亚洲a视频 | 国产精品久久精品 | 日韩在线免费播放 | av中文在线观看 | xx性欧美肥妇精品久久久久久 |