CreCloud云網管管理平臺操作流程
【51CTO.com綜合報道】在互聯網公司,Nagios的應用比較普及,它能夠快速的監控指定主機和其相關服務的運行情況、并在負載有所變化的時候實時告警,極大的方便管理員的日常工作。然而這有一個大前提,那就是Linux/UNIX環境,這對于部分企業來說,可能是一個麻煩,同時在操作習慣上而言,Windows顯得更有吸引力也更簡單。CreCloud云網管正是這樣一款在Windows服務器平臺下運行的,能夠快速部署和使用的監控系統。作為一款原生的Windows下的監控系統,CreCloud云網管秉承了Windows程序一貫的簡潔操作,同時被賦予了強大的監控功能。
安裝
最新版的CreCloud云網管主程序可以從美信科技的官方網站(http://www.mxsoft.com)免費下載到。作為前期準備,我們需要下載兩個軟件,一個就是迷你版主安裝包,另一個是Windows Agent程序,其Agent程序分為32位和64位兩個版本,分別對應32位和64位Windows系統,請大家按需下載。
其安裝過程非常簡單,只需按照提示往下執行即可。在示范中,我將云網管監測平臺安裝在一臺windows2003企業版的機器上。
在安裝過程中, CCU(即監測平臺地址)、數據庫端口、Agent端口參考系統默認值,直接“下一步”即可。大家在實際部署的時候可以根據網絡或防火墻的相關設置,修改為任意可用端口。
接下來,郵件地址是作為CreCloud云網管平臺系統管理報告的接收地址,推薦設置為不填寫(系統默認)。
服務器密碼以及Agent密碼是為有加密需求的用戶提供的高級設置,一般應用中不需要填寫,直接按照系統默認點擊“下一步”即可。
不到1分鐘,程序就安裝完畢,速度非常快。不僅如此,云網管監測平臺占用資源也非常小,安裝成功后,僅僅占用系統50M+的硬盤空間。云網管監測平臺安裝后,還需要不斷采集數據,因此建議大家預留100M-200M的磁盤空間。
至此,云網管監測平臺就安裝成功了。為了進行后續操作,我們還需要在被管理的服務器上安裝Agent。在本例中,我在一臺2008的機器上安裝了64位的Agent。安裝Agent非常簡單,只需按照系統默認,點擊“下一步”直到完成安裝即可。
連接被管理設備
接下來就可以進入功能體驗了。在安裝了云網管監測平臺的windows2003企業版的機器上,多了一個圖標。點擊桌面的“CreCloud云管理平臺”進入我們的主程序。
彈出的登錄界面可以看到,在這里要進行一次身份驗證。需要特別注意的是:如果客戶端和服務器端安裝在同一臺機器上,服務器欄填寫localhost即可;如果客戶端和服務器端安裝在不同機器上,登錄時,服務器欄則需要填寫安裝云網管主程序的IP地址。
登錄成功后,我們可以看到程序的主界面,在左側為設備列表,中部為詳細信息區域,右側為快捷工具欄,可以方便增刪所需要管理的服務器、網絡設備等各種被監測對象。而頂部還有監控、視圖、告警、報告等常用按鈕。
登錄云網管監測平臺后,首先在設備列表內,選中登錄時連接的服務器“監測服務器”,點擊右鍵,在下拉菜單中選擇“配置監測”,并在配置監測點頁面點擊“重新獲取”以獲取監測服務器最新屬性。
獲取完該設備屬性后,大家可根據實際情況選中需要監測的監測點。
如果大家還需要添加其他的被監測設備,可點擊右側快速工具欄中的“增加管理對象功能”添加所要管理的服務器。
選擇AgentWindows設備,點擊確定。在這里我們可以看到,CreCloud云網管不僅支持Windows服務器,同時還支持Linux的SSH/Telnet/Snmp方式連接,以及思科和華為的各類網絡設備等,可管理的設備非常全面。
在接下來的設置界面,我們輸入之前安裝了Agent的2008r2sp1的IP地址以及端口號。
點擊確定后,很快得到了監測項,包括CPU、磁盤、內存、網卡流量等信息。
同時經過簡單設置后,還可以對Top5CPU使用、Windows賬戶是否被修改、以及Windows所有的服務進行監控。在這里我們可以根據需要對DNS、DHCP、IIS等服務進行監控,非常全面的定制化功能,能夠完成很多出人意料的工作。在本例中,只對CPU、磁盤、內存、網絡進行了監控。
點擊確定后,系統進行一次測試,測試結果顯示為三列,分別是監測點、狀態以及測試結果。其中在例子中,由于系統的D盤和G盤磁盤使用率都超過了95%,在狀態中被標以紫色燈的警示圖案。
點擊關閉后,至此“增加管理對象”就算是完成了。#p#
功能體驗
在設備列表中可以看到新加的服務器,正常運行的服務器為綠色、有問題的服務器則根據情況不同標注不同的顏色。
在左側點擊相應的服務器名,我們在右側的“總體報告”中可以直觀的看到CPU使用率、內存使用率、硬盤使用情況等。由于兩個分區使用率過高,因此健康指數只有77分。其中CPU使用率、內存使用率以及網絡使用率均會影響最終的健康指數。由于健康指數的存在,我們可以直觀的對服務器的運行情況有一個快速的了解。
在“詳細信息”頁,我們可以對“總體報告”中的某些具體指標進行更詳細的查看。
而狀態統計則屬于一個范圍性的統計,可以對服務器的整體運行情況進行一個數據化的匯總。
在“告警與事件”中,可以根據描述情況,進一步的挖掘出現故障的原因。
被監測服務器多了之后,為了便于管理,必須要根據一定的準則進行分類,CreCloud云網管也提供了這一功能。我們可以在管理對象視圖中,根據自己的需要,建立不同的服務器組,然后將屬于同一組的服務器劃分到相應的組內。
監測點視圖屬于對告警事件的一個更直觀查看的方式。在數百臺甚至上千臺服務器中,想要快速找出有問題的機器,那么使用這種方式無疑是非常快捷的。鼠標移動到有問題的監控點上,可以彈出相應的告警信息。管理人員在記錄問題狀況后,能夠做到有的放矢,高效解決故障。
統計系統
作為一款監控系統,不能不提到日志系統,因為管理數量的眾多,如果沒有一個準確的日志系統,那么進行誤操作或想查看系統何時出現問題的時候,將無從查起,CreCloud的日志系統簡潔高效,只要輸入查詢時間和查詢條件即可快速得到告警、事件和操作日志的結果。
實時報告也是一項非常實用的功能,我們可以在實時報告頁面,新建一個實時數據,本例做的是內存消耗情況的實時報告,設置項如下圖所示。
點擊確定后返回結果,我們可以直觀的看到各臺被監測服務器內存的使用情況。這對我們是否進行系統優化以及增加物理內存起到了一個參考作用。
考慮到企業中的實際應用,CreCloud云網管提供了嚴格的用戶權限管理模塊,可以做到不同人員對不同的服務器進行管理。
同時對于告警信息的發送,也可以不僅僅依靠郵件和聲音,在擁有短信貓或短信平臺的前提下,我們可以使用更為快捷的短信直接報警功能。
總結
CreCloud云網管系統以其安裝設置流暢、操作簡單、界面友好直觀給我留下了深刻印象。同時它沒有Windows程序的那種習慣性臃腫,僅僅50M+的體積卻可以管理上千臺設備,并且不僅僅局限于Windows主機,它還可以管理Linux/Unix服務器、網絡設備、數據庫、中間件、Web Server、Web應用等幾乎所有數據中心會用到的設備及系統。這是一個擁有高可用功能的監控系統,在中國石油天然氣集團多個項目的大規模應用,驗證了這套系統的穩定和可靠。對于中小企業和習慣了Windows操作系統的系統管理員來說,使用這樣一款系統,可以快速的在企業中部署,同時保持業務的連貫性。