美信云網管晉級第四步:利用“告警”實現運籌帷幄
作為一款高效能的監控平臺,美信CreCloud云網管擁有一套完善的告警系統。通過設置告警,我們可以不需要隨時盯著運維平臺。畢竟相對而言,運維平臺主要的作用在于防患于未然,多數時間,我們的服務和應用都是正常的,而運維平臺所需要發揮作用的時刻則是當服務和應用出現故障時,能夠快速的通知到我們的運維人員。
美信CreCloud云網管支持通過聲音、郵件或短信等多種方式進行告警、我們只需要準備一部能夠收發郵件和短信的智能手機,即可“運籌帷幄千里之外”。設置告警并不復雜,但卻能將我們的時間和精力從枯燥的運維監控上解放出來,在人力成本日益增高的大環境下,美信CreCloud云網管的告警功能更顯得尤為重要。
一、定制郵件模板
在進行告警設置之前,首先要說明的是,我們需要先定制一個告警模板。在首頁點擊設置→左側點擊“告警模板”,依次如下圖所示,新建一個郵件模板。其中郵件模板中提供了非常多的變量參數,方便我們對收信內容的格式和內容進行控制。
設置好模板之后,我們需要定義一下“郵件設置”的發件人和收件人。在這里,發件人意味著以何種身份發出告警郵件,在企業應用中,我們可以定義為postmaster@xxx.com這種發件人,收件人則意味著運維人員,根據具體需求,可以定義多個收件人。
二、增加告警設置
完成模板的定制之后,我們就可以對需要監控的項目進行告警設置了。首先我們在設備管理中,右鍵點擊需要進行告警的服務器,選擇“添加告警”
在彈出的菜單中,我們先對基本信息進行描述,根據實際情況填寫即可。
在“告警范圍”和“監測對象”兩個選項卡中,我們可以勾選關注哪些監測點。比如某些設備我們雖然對它的整個運行狀態都進行監控,如CPU、內存、網絡流量等,但只是希望在網絡流量超過一定范圍時才報警,那么我們可以只勾選“網卡流量監控”這一項。
接下來在動作列表中點一下“添加”,我們增加一個郵件告警,同樣,也可以增加短信和聲音告警。而之前我們所設置的模板,在這里就有了用武之地了。
對于告警規則,也有多種選項可以選擇。在上一次的學習中,我們學習了一個非常重要的概念“閥值”,通過閥值可以確認某一個監測點處于何種狀態,如正常、危險、緊急或者是故障。在這里,我們也可以根據狀態來確定是否發送告警。默認的策略是,連續兩次發現“緊急”或“故障”,則發送告警郵件,同時每間隔3次再發送一次告警。
默認策略并不是一發現故障即告警,而是至少連續發生兩次才告警。這是因為在實際應用中,有可能因為網絡波動或者一瞬間機器壓力過大,導致系統檢測出的結果有偏差,也就是所謂的“誤報”,很明顯這種情況的告警不是我們所需要的。
但如果是持續性的報警,則確認是故障的可能性就大大提高了。一方面,我們不能設置過于敏感的告警信息,以免被這些誤報整的風聲鶴唳;另一方面,我們也不能設置的過于寬松,放過了真正的故障告警。
設置好后,我們就可以耐心等待了。如果告警條件被激活,那么就可以在自己的郵箱看到提示。
看,非常方便吧。用好告警功能,讓你的美信CreCloud云網管再進一步!很多有用功能都等待我們去挖掘,從實踐出發,聯系具體的生產環境,你會發現美信CreCloud云網管會為你越來越好的服務。