海量監(jiān)控的現(xiàn)狀及發(fā)展趨勢研究
【51CTO.com綜合報道】近十年來,網(wǎng)絡(luò)化和信息化成為各行各業(yè)發(fā)展的趨勢,相應(yīng)的,大大小小的數(shù)據(jù)中心、信息中心如雨后春筍般在全國各地建立起來,并且規(guī)模越來越大、應(yīng)用越來越復(fù)雜。數(shù)據(jù)中心、信息中心的建立初衷,是以業(yè)務(wù)開展為主導(dǎo),為實現(xiàn)智能管理和自動辦公提供各種技術(shù)手段,可以說它們是為簡化或方便管理而誕生的。但隨著數(shù)據(jù)中心、信息中心的不斷發(fā)展,它們自身的監(jiān)控管理越來越受到重視,成為IT部門工作中不可缺少的一部分。
目前國內(nèi)網(wǎng)管市場可以簡單地劃分為三大陣營。***大陣營是以HP、IBM為代表的國外四大家,他們網(wǎng)管產(chǎn)品在對服務(wù)器監(jiān)測方面,主要是通過Agent代理監(jiān)測的方式來實現(xiàn)。這類產(chǎn)品的性能穩(wěn)定,占據(jù)了金融、電信市場的半壁江山,但四大家產(chǎn)品的高成本也在一定程度上制約了國內(nèi)網(wǎng)管市場的發(fā)展。第二大陣營以本土廠商為代表,包括MXsoft(美信)、游龍、北塔、摩卡、廣通等企業(yè)。這些企業(yè)依靠相對便宜的二次開發(fā)、本土化的技術(shù)支持和服務(wù)獲得越來越多的市場占有額。同時,隨著客戶和項目的積累,產(chǎn)品也逐漸趨于成熟。三線陣營中,則由全國近百家不知名的相關(guān)軟件廠商所組成。
與此同時,網(wǎng)絡(luò)監(jiān)控管理則從最早的自帶工具發(fā)展至現(xiàn)在的全面管理系統(tǒng),其架構(gòu)和技術(shù)都發(fā)生了一系列的變化:
1.在架構(gòu)設(shè)計上,從單套部署的工具集發(fā)展到以服務(wù)器池為基礎(chǔ)的云網(wǎng)管監(jiān)控架構(gòu);
2.在檢測手段上,從單一的Agent代理監(jiān)測、SNMP監(jiān)測發(fā)展到兼容Agent代理監(jiān)測和各種非代理監(jiān)測;
3.在拓撲管理領(lǐng)域,從基于子網(wǎng)的拓撲技術(shù)發(fā)展到自動搜索的物理拓撲圖,再到手工定制的VISIO拓撲圖,甚至是多種拓撲技術(shù)的融合;
4.在運用方面,發(fā)展到能夠支持各種操作系統(tǒng)、數(shù)據(jù)庫、網(wǎng)絡(luò)設(shè)備和中間件,以及各種業(yè)務(wù)應(yīng)用系統(tǒng);
5.在告警方式上,從單一的界面告警發(fā)展到短信、郵件、聲音和顏色等綜合手段的預(yù)告警。
以上技術(shù)分散在不同的廠商和產(chǎn)品中,在實踐中體現(xiàn)為以下幾種監(jiān)控方式:設(shè)備網(wǎng)管軟件監(jiān)控、通用網(wǎng)管軟件監(jiān)控和云網(wǎng)管監(jiān)控。
網(wǎng)絡(luò)設(shè)備廠商通過自帶網(wǎng)管軟件進行監(jiān)控,比如思科、H3C等設(shè)備廠商都有專用的網(wǎng)管軟件。不過由于這些廠商的網(wǎng)管軟件只能對本廠商的設(shè)備進行監(jiān)控,不能對用戶的所有設(shè)備、網(wǎng)絡(luò)和應(yīng)用系統(tǒng)進行全面、統(tǒng)一監(jiān)控,所以在使用中有很大的局限性。
購買通用網(wǎng)管軟件進行監(jiān)控。傳統(tǒng)的通用網(wǎng)管產(chǎn)品都是以單套部署的原理來工作。即一套產(chǎn)品只能安裝在一臺監(jiān)控服務(wù)器上,這種模式有一定的局限性,其監(jiān)控能力和規(guī)模都受限于這臺監(jiān)控服務(wù)器的性能。當(dāng)被監(jiān)控規(guī)模超過這臺服務(wù)器監(jiān)控極限時,用戶不得不再購買一套產(chǎn)品,安裝在另一臺監(jiān)控服務(wù)器上,對超出部分的被監(jiān)控對象行進監(jiān)控。同時,還需要對用戶、權(quán)限和預(yù)告警數(shù)值等參數(shù)重新設(shè)置。這無疑會大大增加人力、物力上的成本。監(jiān)控的目的是為了提高工作效率,多套傳統(tǒng)網(wǎng)管產(chǎn)品的部署在解決問題的同時卻大大增加了對管理工作的復(fù)雜度。所以傳統(tǒng)網(wǎng)管產(chǎn)品對于海量監(jiān)控往往力不從心。而目前,有很大一部分的用戶需要監(jiān)測的對象越來越多,比較典型的是門戶網(wǎng)站、網(wǎng)游公司和銀行、電信等的大型企業(yè),動輒就要監(jiān)測上千臺服務(wù)器。傳統(tǒng)網(wǎng)管軟件已漸漸無法滿足這類大中型規(guī)模企業(yè)的需求了。
在這種背景下,MXsoft(美信)適時的推出了CreCloud云網(wǎng)管解決方案,CreCloud云網(wǎng)管將云計算技術(shù)的虛擬化和擴容性恰當(dāng)?shù)貞?yīng)用到了海量監(jiān)控的管理實踐中,***地解決了海量監(jiān)控的各種問題。它的工作原理可以簡單概括為:將多臺普通監(jiān)控服務(wù)器虛擬為一臺計算能力強、運行穩(wěn)定的大型監(jiān)控服務(wù)器,幫助用戶在低成本的情況下,實現(xiàn)對海量設(shè)備、網(wǎng)絡(luò)和應(yīng)用系統(tǒng)的監(jiān)控;同時可根據(jù)被監(jiān)控對象的規(guī)模大小動態(tài)的增減監(jiān)控服務(wù)器。
比如中石油目前有超過20000個加油站,總部需要對各加油站業(yè)務(wù)系統(tǒng)進行管理,實時監(jiān)控其網(wǎng)絡(luò)狀況、文件系統(tǒng)、日志、CPU利用率、內(nèi)存使用情況、網(wǎng)口流量、系統(tǒng)crash 、重要業(yè)務(wù)系統(tǒng)進程、磁盤空間分配、網(wǎng)絡(luò)流量等等。需要監(jiān)控的設(shè)備數(shù)量達到10萬臺,監(jiān)測點則近百萬。如何解決這一巨大規(guī)模的監(jiān)控問題呢?通過采用CreCloud云網(wǎng)管監(jiān)控方案,不但性能穩(wěn)定,更能應(yīng)對今后的擴容需求。
中石油通過實施MXsoft(美信)的CreCloud云網(wǎng)管監(jiān)控方案實現(xiàn)以下優(yōu)勢:
虛擬化,大大增強平臺監(jiān)控能力。將多臺普通監(jiān)控服務(wù)器虛擬為一臺計算能力強、運行穩(wěn)定的大型監(jiān)控服務(wù)器,或稱之為監(jiān)測云,可以監(jiān)控目前任何規(guī)模的服務(wù)器群。
動態(tài)擴容,即支持監(jiān)測服務(wù)器熱插拔。當(dāng)企業(yè)的監(jiān)控規(guī)模增加或減少時,監(jiān)控管理人員只需要動態(tài)的增加或減少監(jiān)測服務(wù)器,即可滿足監(jiān)控需求。
自動負載均衡。主控服務(wù)器會根據(jù)監(jiān)控服務(wù)器的性能自動分配任務(wù),而不需要監(jiān)控管理人員手動分配;如果監(jiān)測服務(wù)器中的某一臺或幾臺發(fā)生了宕機,其它監(jiān)測服務(wù)器就自動接管它們的任務(wù),保障業(yè)務(wù)7天*24小時不間斷運行。
秒級輪詢。云網(wǎng)管海量監(jiān)測將監(jiān)測點的顆粒度精確到秒級,以保證監(jiān)測數(shù)據(jù)的實時性和精確性,做到當(dāng)客戶關(guān)鍵設(shè)備出現(xiàn)異常時能在***時間里發(fā)現(xiàn)問題,發(fā)出報警,為客戶解決問題贏得寶貴的時間。
在目前的網(wǎng)絡(luò)監(jiān)控管理實踐中,隨著用戶業(yè)務(wù)的不斷發(fā)展以及數(shù)據(jù)中心建設(shè)的不斷擴大,海量監(jiān)控的需求越來越突出。特別是門戶網(wǎng)站、網(wǎng)絡(luò)游戲、電信、銀行和石化等大中型企業(yè),IT業(yè)務(wù)復(fù)雜、系統(tǒng)龐大、設(shè)備繁多,海量監(jiān)控是勢在必行的趨勢。
從2000年到現(xiàn)在,國內(nèi)網(wǎng)絡(luò)監(jiān)控軟件行業(yè)已經(jīng)走過了10個年頭。這10年歷程中,國內(nèi)網(wǎng)管技術(shù)不斷創(chuàng)新,從對國外技術(shù)的簡單模仿到推陳出新,再到國際領(lǐng)先,國內(nèi)網(wǎng)管廠商正在變得越來越成熟。