企業網管:你不是一個人在戰斗
自從1987年11月,SGMP(Simple Gateway Monitoring Protocol,即簡單網關監控協議)出現之后,管理員們便擺脫了利用ICMP來偵測主機是否在線服務的簡單管理時代。隨著網絡管理需求的迅速增長,而后出現了兩個影響力極大的管理協議:
CMIP(Common Management Information Protocol)即通用管理信息協議,建立在開放系統互連通信模式上的網絡管理協議;
SNMP(Simple Network Management Protocol)即簡單網絡管理協議,也可理解為SGMP的升級版。
SNMP最初的標準確定之后,很快被眾多的廠商設備所支持,并且發展到并不“簡單”的地位。在這期間,一是因為SNMP的簡單性(SNMP只關注于一些簡單的數據、特性和變量),二是由于網絡管理員和系統管理員的“從眾心理”,SNMP得到了長足的發展。它被廣泛接受并成為現今網管軟件基礎架構的鼻祖,經過三次的版本演化,它在網管人員和系統工程師的心中可以說根深蒂固。很多管理員甚至將SNMP管理視為發現和解決一切故障的法寶,但隨著網絡和系統管理任務的增多,自己編寫腳本就顯得越發的復雜和吃力,例如操作系統、數據庫和郵件系統的更新換代,以及跨平臺數據庫的統一管理,都使得很多人已經陷入了系統管理的泥潭,無法自拔。
系統管理的橫向發展
SNMP本質目的是保證管理信息在任意兩點中傳送,便于網絡管理員在網絡上的任何節點檢索信息,同時可以進行修改,以便尋找故障。系統管理員借助故障診斷、重新確定閥值規劃與生成報告。其***的優點是采用輪詢機制,提供最基本的功能和最快速的調試,適合小型、快速、簡單的環境使用。
起初,網絡管理框架主要負責監視重要的網絡設備和一些核心的運行統計數據。例如很多管理員使用的NetSnmp,它通過SNMP協議(SNMPv1(RFC1155-1157)、SNMPv2(RFC 1901-1908)、SNMPv3 (RFC 2571-2574)中的命令,調用設備MIB庫的對象標識符OID串,編寫腳本集中提取設備的參數值,如CPU利用率、內存利用率、進程狀態、時延、端口流量、性能參數等。而系統管理隨著企業信息化步伐的加快,早已擺脫了主機管理的局面,正向著IT資源整合等橫向功能發展。系統管理的范圍包含網絡系統、主機系統、數據庫系統和應用系統,以及安全產品等。
系統管理更注重收集網絡內運行的數據信息,提供網絡的性能統計, 并完成性能分析與容量規劃。分析歷史統計數據,優化網絡性能,消除網絡與主機中的瓶頸;決定網絡負載的合理安排、網絡資源的高效利用和為下一步的容量規劃提供決策依據 。這些企業需求的存在,僅靠系統工程師參照“白皮書”編程,是無法完成的,單純依靠SNMP無法與系統管理的重要性和復雜性并行發展。
你不是一個人在戰斗
企業信息系統管理是一項龐大而復雜的工程。功能的實現往往需要借助于多種措施和設置,而導致故障發生往往由于多種原因,既可能是“一因多果”,也可能是“一果多因”。所以系統管理絕對不是依據SNMP來隨時觀察系統的工作狀態,而是用全面、動態和聯系的眼光分析問題,進行邏輯推理,從紛繁復雜的現象中發現事物的本質。比如我們對CPU的理解,SNMP只會告訴我們它工作的狀態,但不會告訴我們資源的使用應該如何優化。以Oracle數據庫管理為例,為了對CPU故障進行定位,用戶首先必須能夠準確的評估出系統所用CPU資源的總量,隨后,用戶還必須確定系統是否具有充足的CPU資源,并識別出何時系統所消耗CPU資源的總量最多。如果性能故障的主要原因歸結于當前系統的配置(服務器不具備足夠的CPU和內存資源來運行程序),單一的系統管理方案只能提供升級配置或減少應用占用兩種方案。如果單純的依靠SNMP管理模型,那么后續的工作將依然受到一定程度的限制。
系統管理和SNMP的重心都同樣在于裝置的監看和控制,但系統管理將裝置視為是整體,或是一群相關服務的集合。而SNMP很多時候將提供服務的設備視為是系統的一小部份。你也可以這樣來看待兩者的差別:一者是只關心特定裝置的順利運轉(SNMP),另一者是關心整體網絡的健全運作與長遠發展。
一個合格的管理員必須要熟悉主流廠商的基本網絡設備(包括交換機、路由器)的配置和調試方法,,同時,為了保障網絡的正常穩定運行,網管員還必須了解和掌握網絡安全設備(包括防火墻、IDS)的服務器加固的配置和調試方法,制定安全策略,根據實際需求,配置好網絡設備和服務器設備,使它們能發揮***的、***的效果。依據Telecommunications Management Network (TMN) 對網絡管理的層次劃分,分別為:
商業管理層(Business Management Layer):執行商業方面的相關功能,分析發展趨勢如質量問題,提供記帳基礎和其它財務報告。
服務管理層(Service Management Layer):執行網絡服務處理功能:定義、管理和服務控制。
網絡管理層(Network Management Layer):執行網絡資源分配功能:配置、控制和網絡監督。
單元管理層(Element Management Layer):包含個人網絡單元的處理功能。即:警報管理、信息處理、文件備份、日志、硬件和軟件的維護等。
以這套理論為基礎,一個不容爭議的事實擺在了我們面前:“一個人的力量是十分有限的”。即使一個優秀的管理員也不可能將網絡管理設計,企業信息系統分析、技術限制、企業目的、技術目的等全部掌控。因此,選擇一款成熟的網絡與系統管理軟件,不單是解決技術的問題,而是關于企業的生產力與競爭力問題。
【編輯推薦】