透過現象抓本質,看北塔BTNM如何解決銀行網絡運維難題
近年來隨著我國加入WTO,國內銀行特別是長期處于政府保護之中的國有商業銀行,面臨的競爭壓力是越來越大。除了外資銀行不斷引入的挑戰外,國有商業銀行改革的挑戰也是不能忽視。如何提升國有商業銀行的戰斗力呢?大多數人都認為還是要提升銀行的服務水平入手,只有保障良好的金融網絡運行環境,才能提高銀行自身的生存能力。作為IT運維管理專家,北塔軟件針對金融行業提供了專業的運維管理解決方案,為維護良好的金融網絡運行環境做出了優異的成績和應有的貢獻。
下面我們舉例一個北塔軟件在某銀行的金融網絡中發現問題和排查問題的過程:
告警描述:某銀行網絡出現故障,多臺交換設備不能獲取SNMP信息,發生告警;伴隨著一些業務有連接振蕩現象(連接時通時不通)。
管理人員立即啟用北塔BTNM進行了層層深入的剖析,并最終發現了問題的根源所在:
某銀行的網絡架構圖
第一回合:
問題分析:出現問題的設備型號不一致、網絡所在位置不相同,沒有固定規律,管理員懷疑是網管機中病毒的原因,導致處理數度緩慢不能接收某些交換機SNMP信息。
測試手段:管理員更換新安裝網管軟件的網管機。
結果:問題依舊,有問題的交換機還有取不到數據,正常的交換機取數仍然正常。
第二回合:
問題分析:網管機沒有病毒,管理員考慮是否監控設備數量過多,導致處理數度緩慢不能接收某些交換機SNMP信息。
測試手段:于是減少了網管機的監控設備數量(只監控核心路由B、存在故障和無故障的營業點交換機各一臺)。
測試結果:問題依舊,
第三回合:
問題分析:在排除網管機中毒的可能性后,問題還是回到網絡層面上來。管理員陷入了沉思,在過往的工作經驗中有因防火墻不能處理過多SNMP包,而導致丟包現象,或許是這個原因?
測試手段:管理員更改了線路連接方法,讓網管機直接連接到有問題的“核心路由B”上。
測試結果:“核心路由B”能夠獲取SNMP數據,但是營業點的交換機還是存在故障的不能取到數據,正常交換機沒有異常,一樣能取到數據。
第四回合:
問題分析:防火墻導致丟包可能性被排除后,問題落在“核心路由B”上了,設備“核心路由B”以前一直能夠奪取到SNMP數據,最近沒有作過IOS升級,不可能是設備的自身問題;
如果設備“核心路由B”真的有問題,是否表示只要經過該設備,進行數據交換的營業點交換機就出現問題呢?
測試手段:管理員通過靜態路由方式,讓存在故障的營業點交換機的路由,通過“核心路由A”來交換,同時再讓正常工作的營業點交換機的路由,通過“核心路由B”來交換。
測試結果:好的營業點交換機通過有問題的“核心路由B” 來交換數據,變壞了;有問題的營業點交換機通過好的“核心路由A”來交換,故障消失。
第五回合:
問題分析:問題已經鎖定在設備“核心路由B”上,那樣到底是設備“核心路由B”的處理能力問題?還是訪問列表等配置問題呢?
測試手段:查看CPU處理值,查看訪問列表
測試結果:CPU只有19%的占用率,不是性能問題。網管員只能查看數百條的訪問列表配置了,最終還是找到了有沖突的訪問列表,修正后所有的設備SNMP取數回復正常。
問題總結:由于網絡管理員過多使用訪問列表,或使用訪問列表不當,導致出現上述問題,通常這種“軟故障”是最難處理的,但是在通過北塔軟件有效的監控手段下,是能夠及時的發現這種“軟故障”。并且還通過北塔BTNM網絡拓撲圖,管理人員能夠快速定位哪些設備同時出現了該問題,并快速判斷這些設備是否在同一個網絡結構層面上,是否同型號的設備等數據分析結論。
所以說,北塔BTNM不但能夠自動地發現網絡上地問題,還能夠為管理人員提供數據分析,并最終圓滿解決問題,成為管理人員保障好金融網絡系統的得力助手。北塔BTNM從網絡管理的角度提升了科技競爭實力,有力推動了國內商業銀行的信息化建設。