紅帽與NVIDIA聯合開發開源解決方案,推動新興工作負載的處理
全球領先的開源解決方案提供商紅帽公司(紐交所代碼:RHT)近日宣布與NVIDIA(英偉達)合作,圍繞人工智能 (AI)、深度學習和數據科學等新興工作負載,將新一輪開放式創新帶到世界各地的企業數據中心。這項工作的推動力是在NVIDIA® DGX-1™系統上對***的企業Linux平臺 — 紅帽企業Linux進行認證。該認證為包括紅帽OpenShift在內的紅帽產品組合奠定了基礎,讓它們可以在NVIDIA的AI超級計算機上進行部署并獲得聯合支持。
對于希望通過數字化轉型獲得競爭優勢和市場差異化的企業而言,人工智能通常被視為一種支持技術。研究公司Ovum強調了業界對人工智能日益增長的興趣,調查顯示:“對人工智能舉措(即規劃、試驗或部署)積極關注的企業比例從去年的62%上升到今年的77%[2018年]。”
隨著NVIDIA DGX-1系統進入數據中心提供強大的AI平臺,IT團隊希望在現有運營流程中管理和維護這些系統,而這些運營流程通常基于紅帽企業Linux。在NVIDIA DGX-1硬件上使用紅帽企業Linux不僅可以提供熟悉的控制面和安全的SELinux用戶環境,使IT團隊能夠將這些融合到現有的工作流程中,而且還可以作為催化劑,推動AI的進一步創新和深度學習。
現在,包括公共部門、石油和天然氣、金融服務等領域的企業都能夠更有效地將NVIDIA架構集成到現有基礎架構環境中,而紅帽企業Linux在這些環境中充當共同的 “橋梁”。為了使企業環境具有更大的靈活性,目前的紅帽企業Linux企業用戶將能夠在NVIDIA DGX-1系統上使用現有的訂閱,該系統由紅帽企業Linux和NVIDIA共同支持。此外,在NVIDIA DGX-1系統上使用紅帽企業Linux的組織也將在紅帽OpenShift中擁有業界最全面的企業Kubernetes產品系列作為基礎,從而將云原生支持能力擴展到新興工作負載。
ISV可以將現有的通過紅帽企業Linux認證的應用程序遷移到NVIDIA的新系統當中,幾乎不需要做出任何更改就可以更輕松地訪問高級AI和深度學習功能,支持更多智能工作負載。
在高性能計算領域,紅帽和NVIDIA都提供了技術和專業知識,為世界上最快的兩臺超級計算機Summit和Sierra提供支持。作為眾多行業***群體的一員,紅帽幫助這兩個系統上線運行,這不僅為性能敏感環境中的下一代高性能計算 (HPC) 提供了模型,而且為未來的企業數據中心提供了模型。
除了在NVIDIA DGX系統獲得紅帽企業Linux的認證并受支持,兩家公司還打算在更廣泛的開源項目上展開合作,包括:
- 基于紅帽OpenShift的NVIDIA GPU云 (NGC) 容器 - 紅帽和NVIDIA計劃提供NGC容器,為用戶提供基于紅帽技術的AI和HPC GPU優化軟件工具,使雙方客戶能夠充分利用NVIDIA GPU的性能。
- 異構內存管理 (HMM) - 紅帽和NVIDIA計劃繼續進行異構內存管理 (HMM) 特性的上游開發。此內核特性允許設備訪問系統內存并將其映射到自身內存中,從而顯著提高使用GPU的應用的性能。
引用語錄
紅帽***技術官Chris Wright
“業界對性能敏感工作負載(如人工智能和知識學習)的興趣日益提高,這需要采用不同的企業計算理念,而NVIDIA已經借助NVIDIA DGX-1在架構層面上幫助解決了這一問題。通過紅帽企業Linux和紅帽OpenShift,紅帽正在為NVIDIA強大的硬件增加企業級軟件創新,幫助企業推動新興工作負載的處理,同時保持其生產系統的穩定性、可靠性和熟悉度。”
NVIDIA DGX系統高級總監Charlie Boyle
“NVIDIA DGX系統與NVIDIA優化的AI軟件相結合,為從桌面到數據中心的數據科學工作流程提供了強大的性能、生產力和價值。通過紅帽企業Linux在DGX-1上獲得的認證,對于那些期望在軟件堆棧的各個層面獲得企業支持的客戶,我們使企業IT部門能夠滿足這些客戶不斷增長的需求,同時又不會妨礙客戶輕松地進行AI探索。”
Livermore Computing***技術官、Lawrence Livermore國家實驗室高級技術系統主管Bronis Supinski
“Sierra超級計算機配置的NVIDIA GPU對紅帽企業Linux的支持為我們的系統提供了通用性,極大地提升了我們的用戶充分利用世界上速度排名第三的計算機的強大能力。由于我們使用紅帽企業Linux作為我們產品技術系統上軟件堆棧的一部分,因此,GPU的啟用減少了將應用程序遷移到Sierra所需的工作量,我們預計,這一能力將惠及其他基于GPU的系統,例如DGX-1。”
SAIC***技術官Charles Onstott
“通過我們的創新工廠,以及我們與紅帽和NVIDIA的重要合作伙伴關系,SAIC展示了在快速測試和集成GPU上部署堆棧元素,以及優化我們分析引擎性能方面的敏捷性和協作能力。我們設計、部署和演示產品的時間縮短為數周,并將繼續以真正DevOps的方式進行迭代。”