我們為什么需要自我修復SD-WAN
企業需要在SD-WAN中構建必要的信息,以預測問題并采取糾正措施。只有這樣,SD-WAN才會繼續工作。自我修復SD-WAN動態地補償網絡中的錯誤,從而***限度地減少對更高層次服務(即應用程序)的干擾。與SD-WAN相關的自我修復涉及以下四個功能:
- 監控支持SD-WAN的設備和鏈路,收集低級統計信息,如丟包、延遲和抖動。
- 檢測線路特征何時超過定義的閾值或底襯的某些部分變得不可用。
- 理想情況下,采取行動搶占和提醒網絡問題。
- 調整安全性和其他支持網絡服務,以***限度地減少并防止應用層中斷。
這些功能必須在全球網絡的所有層面實施,包括設備,站點,區域和全球網絡。
在設備級別,自我修復的SD-WAN必須防止組件故障,例如支持設備中的電源或硬盤。至少這意味著防止SD-WAN接入設備中的組件故障。如果其他設備對于企業網絡至關重要,例如防火墻或WAN優化設備,則需要保護這些設備免受組件故障的影響。
在站點級別,自我修復的SD-WAN不僅可以從支持SD-WAN的設備完全故障中恢復,還可以解決該設備路徑中以及***一英里的限制和停電問題。在網絡設計中應將冗余的路徑放置到設備所在的位置,然后采用雙歸位接入線路接入互聯網。正如該公式所示,即使是雙寬帶連接也可以接近MPLS的理論可用性,但這假設寬帶基礎設施的所有部分都是冗余的,包括訪問SD-WAN設備。實際上,這意味著SD-WAN分支設備的HA配置必須足夠簡單,任何人都可以部署,并且價格合理,可以廣泛采用企業。
自我修復的SD-WAN必須能夠補償數據包丟失,特別是在網絡條件最常見的***一英里。諸如分組復制之類的分組丟失校正技術已經很好地建立。如果丟包率過高,或者應該停電,那么自我修復的SD-WAN將根據業務優先級控制流量不足的鏈路周圍的流量。實際上,大多數SD-WAN解決方案提供***一英里自我修復,在主動/主動配置中運行,實時監控線路性能,然后使用基于策略的路由和應用程序配置文件將流量引導到***鏈路。
區域和全球層級的自我修復
當您轉向網絡核心時,問題將根據您的SD-WAN架構而有所不同。當SD-WAN解決方案僅依賴于互聯網時,與SD-WAN邊緣解決方案的關注一樣,對區域和全球網絡的可達性的關注較少。在這些網絡中經常(但肯定不是總是)存在重要的路徑和冗余以防止完全中斷。然而,人們非常擔心停電問題。全球互聯網連接的不穩定和往往較差的表現已有詳細記錄,顯示延遲和丟失率遠高于私人管理網絡。
對于依賴互聯網訪問本地存在點(PoP)但是私有管理主干而不是互聯網來連接這些PoP的SD-WAN,情況恰恰相反。對于私有骨干網,SD-WAN的延遲通常會超過互聯網的延遲,但可達性是另一個問題。IT經理必須檢查這些SD-WAN中是否內置了足夠的智能,路徑和冗余,以確保自我修復。
更具體地說,這意味著在區域級別,PoP組件需要在內部中斷的情況下通過它們之間的故障轉移而變得冗余。如果站點失去與PoP的連接,無論是由于路徑問題還是由于組件故障,它們都應該自動重新連接到下一個最近的PoP,這個過程應該繼續,直到連接到PoP。
在全球網絡的核心內,PoP本身需要從線路中斷中恢復并控制故障鏈路周圍的流量。全球中間距離的延遲尤其重要。PoP應該能夠考慮直接和間接路由,為每個應用選擇它們之間的***路徑。如果一個PoP到PoP連接出現掉電或停電,則應采取替代路徑。
自我修復和應用
最終,自我修復的目標是防止網絡中斷影響業務。在連接之間進行故障轉移或故障恢復是不夠的,必須根據業務優先級來適應不斷變化的流量模式。同樣,自我修復網絡還必須調整支持跨全球網絡交付應用程序的其他設備和服務,例如安全策略和WAN優化規則。
如果不這樣做可能會阻止用戶訪問應用程序和資源,即使SD-WAN已適應中斷。例如,兩個物理數據中心之間的vMotioning工作負載可以成功,但用戶可能仍然無法訪問該應用程序。需要更新第二數據中心防火墻中的安全規則,以允許訪問出現在第二個數據中心的現有新IP。自愈網絡必須解決這種情況,更新必要的網絡服務以防止應用層中斷。
在設計SD-WAN時,要考慮到每一種可能的故障轉移場景是不可能的。我們需要在SD-WAN中構建必要的信息,以預測問題并采取糾正措施。只有這樣,我們的SD-WAN才能在停電時繼續工作。