如何打造高可靠的全閃存陣列?
全閃存時代到來,“快”、“穩”無疑是企業用戶的定心丸,那么如何打造一款高可靠的全閃存陣列?華為OceanStor Dorado V3具備全面的可靠性技術手段,帶來不一樣的高可靠體驗!
對于華為全閃存系統的可靠性,之前已經從介質可靠性、系統級可靠性、解決方案級可靠性三個層面進行了全面的介紹,本篇將著重從系統可靠性層面為大家做進一步的解讀。
冗余是硬件架構的基礎
OceanStor Dorado V3采用模塊化和無源背板設計,所有模塊都采用冗余設計,且模塊間的互聯網絡也采用冗余鏈路,任何一個模塊故障,都不會影響業務連續性。
預警是關鍵技術
只有預防才是硬道理,相比模塊故障后的業務倒換,預防可以進一步降低對業務的影響,在預警后繼續保持業務的連續性,并提示客戶在適當的時間進行更換,大約68%的故障都可以通過提前預警進行規避。
OceanStor Dorado V3針對鏈路亞健康、壽命部件、高失效率器件進行預警,避免產品壽命末期或故障累積出現雙重故障導致業務中斷。具體預警部件包括內存、BBU(備電模塊)、風扇、SSD盤、互連的所有鏈路,通過全面的預警技術,實現對這些部件的提前告警,提前維護,進而在業務受影響前進行更換,提高業務連續性。
故障檢測、修復和隔離是必備技術
該技術是發揮冗余部件能力的基礎,同時也是華為存儲十幾年的持續積累結果,如果沒有該技術,則冗余就是虛假冗余。OceanStor Dorado V3采用分層檢測隔離技術,所謂分層,就是通過硬件邏輯層、驅動層、業務層三個層次模塊,自我檢測隔離和模塊間相互檢測隔離,實現了模塊間的解耦,有效避免故障模塊影響正常模塊的工作,以及故障擴散,真實實現系統高可用性。
關鍵部件高可靠是基礎中的基礎
作為整個系統的連接單元,背板是系統的關鍵部件。為了提升系統可靠性,背板采用無源化設計,必要的有源器件采用了1+1冗余設計,故障率極低,完全可以滿足系統可靠性要求。
作為存儲系統工作的大腦,控制器的重要性不言而喻。為了降低控制器的故障率,從器件選型到生產加工,再到嚴格的篩選過程,讓企業用戶獲得放心的產品。同時控制器實時的狀態監控,可以隨時上報控制器的健康狀態,方便用戶輕松維護。
SSD(固態硬盤)是數據存儲的最終部件,華為SSD的MTBF(盤平均故障間隔時間)為300萬小時,領先業內水平50%,讓存放數據更放心,而且其關鍵的數據校驗算法、冗余配置、備電分組冗余等技術,是SSD可靠的重要支撐。
BBU(備電模塊)是數據保護的關鍵部件,其壽命領先業內水平66.6%,常溫狀態下系統整個生命周期免更換,并且具備三重安全保護。
華為OceanStor Dorado6000 V3正視圖
綜上,OceanStor Dorado V3具備部件、冗余、預警、故障檢測修復隔離四個層面的技術支撐,也是華為十幾年持續積累和創新的結果,為企業的核心業務運行保駕護航!