“別人家車廠”2.5分鐘下線一輛汽車 急需呼喚神龍!
2017地表上最快的計算機
基于HPCC平臺神威太湖一號(Sunway TaihuLight) 全球***理論性能超過每秒10億億次。看看斯坦福大學的Dell HPC集群如下圖:https://www.top500.org/site/50628
在螺螄粉的故鄉, 創造著這樣一個汽車神話,它不是汽車里速度最快的,它也不是汽車里***雅豪華的,但是它曾經創造了一臺車成為全球銷量最多的車型, 如今依舊在書寫著傳奇。然而隨著中國經濟的不斷發展,國富民強,人們對汽車的要求不僅僅停留在代步,經濟緊湊的階段。更多的車型以及內飾的需求如同雪花般的經過經銷商飛向客戶的研發部門。如何加快產品的研發迭代速度,縮短設計和分析的循環周期,如何更快的滿足客戶和市場的需求成為擺在客戶研發領導面前的一道難題。公司領導按照奧林匹克的精神對研發部門提出了“更快,更高,更強”的奮斗目標。可是研發部門也面臨著難題,按照車廠要求,整車級別網格尺寸為8~10mm,所以強度疲勞方面***網格數量大概500W,安全的模型算上假人的話,大約350w單元。帶假人計算時,他們用12個CPU測試計算時間大約24小時。 CFD(整車級別)網格數量約3500W, 32個CPU計算時間為60小時左右。一個設計人員提交作業需要等待24小時-- 60小時, 而且都是協同作業,一人工作,大家等待?這個速度嚴重拖累了這個現代化車廠的后腿, 業界老大哥豐田的精益模式是2.5分鐘就能下線一輛汽車的, 急需呼喚神龍!
記得某位偉人曾經說過,要想解決問題就必須深入到生產戰斗的一線去,那小D也來看看一個汽車設計工程師一天是如何度過的。在吃過了美味的螺螄粉后,工程師打開了它的戴爾工作站,一堆熟悉的圖標映入了眼簾,打開了UG設計軟件,從公司的PDM(產品數據管理系統)系統上下載了今天的工作文檔,手指在鼠標和鍵盤上飛舞,一輛心儀的汽車設計圖紙就完工了。
緊接著,工程師就會使用工具軟件(Hypermesh)對模型進行網格劃分,這道工序他們親切的稱為前處理。做完了前處理以后,就交給我們的CAE軟件求解了。CAE軟件五花八門就像一個大江湖,但是按照門派分,大致可以分成 結構分析、NVH、碰撞安全、CFD(空氣動力學分析、熱管理分析、成員舒適性分析)、約束產品五大門派。談到這5大門派,其實常用的武功(軟件)多達幾十種之多,主要的軟件及分類下表:
接著當您看到工作站的硬盤燈在狂閃,CPU利用率一直居高不下的時候,您應該意識到求解器正在努力的算啊算。當求解完成后CAE的結果需要用CAD技術生成形象的圖形輸出,如生成位移圖,應力,溫度,壓力分布的彩色明暗圖,我們稱它為后處理。一旦后處理做完了,工程師會喝上一杯美美的咖啡,然后完成***的CAE分析報告,整個工作就告一段落了。
看完了工程師的一天的工作流程之后,相信聰明的您肯定發現這個流程中的瓶頸在哪里了?對的,單臺工作站的硬件配置是有限的,計算一個小零件或者一個車門運算量或許還能承受,但對于數據量較大的整車模型,工作站就明顯有點力不從心了。這個時候CAE協同計算平臺就成了我們需要呼喚的那條神龍。一個合格的CAE協同計算平臺需要包括以下子模塊:
- VDI遠程可視化設計桌面
- CAE虛擬仿真(網格劃分及前后處理)
- HPC高性能計算(FEA&CFD仿真分析)
- 交互式作業、批處理作業提交與管理
- 批量作業提交與管理
- 仿真數據管理(仿真數據自動按照軟件、項目、類型、作業自動化管理)
- 仿真項目管理功能
- 仿真數據備份管理
- 集群管理與監控(支持集群界面化的系統用戶、部門、部門角色添加和管理)
- HPC許可證資源管理
從以上模塊可以看出來,一個CAE協同計算平臺基本涵蓋了一個CAE工程師一天工作所要做的所有的事情,包括前后處理,計算,仿真數據管理,備份以及平臺監控等等。戴爾的CAE協同計算平臺邏輯拓撲圖如下,從底層的硬件平臺到OS/編譯環境再到平臺軟件,戴爾可以提供端到端的整體解決方案。
這篇文章里面我們著重闡述戴爾高性能計算解決方案,高性能運算就是利用一個集群中的多臺機器共同完成同一件任務,使得完成任務的速度和可靠性都遠遠高于單機運行的效果,彌補了單機性能上的不足。本文我們將會從網絡,計算服務器,存儲,集群軟件分別描述高性能計算解決方案的主要構成部分。
高性能計算網絡
高性能計算的網絡可以分成3類:
- 計算網絡:各服務器之間進行通訊交互的計算網絡,推薦采用高速、低延遲的戴爾56GB Infiniband 網絡交換機加以配套的HBA卡和IB線纜,以保證將集群軟件在分發任務到多個計算節點的過程中保證各節點之間能夠高速傳輸數據。
- 存儲網絡:CAE軟件將計算任務提交到計算節點,計算節點通過計算最終會產生很大的文件數據,為了高效的存儲這些數據,存儲端采用光纖交換網絡保證計算節點的數據可以快速的存放到存儲中。整個存儲網絡要求高帶寬低延時。
- 管理網絡:除了計算網絡,存儲網絡外,我們還有管理網絡,通過戴爾的以太網交換機,將各個計算節點, 存儲結點, 光纖存儲都納入到Dell OpenManage Essentials管理平臺進行統一管理并結合自帶的告警平臺進行監控,降低管理員的運維壓力。
高性能計算服務器
計算是高性能運算的核心模塊,它的功能就是執行計算。不同的CAE軟件對于CPU和內存的需求各不相同,我們也會把計算節點分為胖/瘦節點,以胖節點為例,它就適用于對內存、處理性能要求高的計算任務,在實際應用中可以需要根據需求和預算來決定采用什么樣的配置。因為一個計算節點的失效通常不會影響其他節點,所以計算節點不需要冗余的硬件保護。
分布式高性能存儲
存儲采用在高性能計算領域普遍使用的Lustre 分布式存儲解決方案,2臺戴爾R730服務器作為Lustre存儲元數據節點,保證高可用性,多臺R730組成Lustre對象數據節點,在保證節點的高可用性的前提下,數據分別從不同的節點高速傳輸到存儲中。從整個架構上消除存儲設計的瓶頸,為后續的數據持續增長,快速橫向擴展提供便利條件。
高性能集群軟件
戴爾聯合優質合作伙伴提供具有大量用戶實際使用案例的高性能集群軟件,覆蓋統一訪問門戶,集群運維管理,監控,計算任務的分發,計算任務的調度,許可證管理,統計記賬,計算數據管理等等功能。同時個性化的能夠結合CAE軟件提供集成接口等功能,更好的方便后續用戶管理和運維高性能計算集群環境。
解決方案拓撲:
解決方案產品:
- M1000e
- 10Gb Dell MXL Blade Switch
- M630
- M830
- R730
- Brocade 300
- Powervault MD3400
- IB Switch(MSX6036)
- Dell HPCC services
- Lusture
解決方案效果:
實施完一期的HPCC 后,作業效率大大提高,項目目標提前完成,該部門多次受到表揚, 工程師有時間在享受完一碗正宗的螺螄粉后,思考更多的項目創新。
戴爾的高性能計算解決方案——我們眼中的“利器”不但是為中國汽車生產制造貢獻了一份力量,同時還在眾多如氣象地震分析、石油勘探、基因工程、動漫特技渲染、生物制藥等涉及國家科技及普及民生的眾多領域,承擔了技術改良和發展的責任。戴爾一直在高性能計算領域處于***地位,致力于設計開放、性能出色及高性價比的解決方案,為客戶帶來更大的靈活性、更高價值及更便捷的業務運營。