數據中心監控:云服務水平協議骨干
維護一個健壯的云服務水平協議說起來比做起來容易得多。云提供商嚴重依賴云數據中心監控技術,來降低可能的宕機風險,以此確保其客戶最低限度的宕機時間。
無論提供商依賴的云數據中心監控軟件來自于廠商還是內部開發的技術,容量和性能監控和管理都能夠協助云提供商為其云服務水平協議(SLA)感到自豪。
云服務水平協議始于數據中心
VMware最近宣布收購了實時日志分析產品Log Insight,從而加強其數據中心管理產品資產,該產品來自于一家提供基于數據挖掘技術的提供商Pattern Insight.這項技術能夠協助云提供商管理器數據中心的可擴展性和復雜性,VMware技術專家Jon Herlocker在其博客中寫到。“為了保持競爭力,企業將被迫收集更多關于流程的數據,并進行越來越深入的分析。數據中心將會須要更多的結點來存儲數據,此外還要更多的計算結點來處理。這也意味著他們需要更為復雜的分析工具,”Herlocker表示。
根據Pattern Insight介紹,Log Insight結合了分析和日志管理技術,就像Twitter的訂閱(feed),協助管理人員快速找到導致問題的根源。
云提供商整在尋找傳統的服務器和物理基礎架構監控工具來尋找故障并管理其云環境,從而支撐起云計算服務水平協議,但是并不是所有的廠商都已經發展的足夠好,滿足了云基礎架構的獨特需求。
Terremark是Verizon的云服務子公司,在尋求數據中心基礎架構管理廠商(DCIM)來滿足云提供商的業務模型失敗后,已經開發了自己的數據中心監控技術。Terremark監控其數據中心的電源和制冷水平,但是也需要準備并容量規劃技術,為了確定哪里最適合部署客戶服務,Ben Stewart指出,他是Terremark設備工程高級VP。
“當我們在地面上部署一個新的客戶,他們都連接到相同的共享的基礎架構上,在所有時間里,我們都有一個平衡的基礎架構,因此,一個客戶并不會影響另一個客戶,”他說道。這個自主研發的數據中心監控技術追蹤電源電路和基礎架構活動,連接到一個報警管理系統,Stewart指出。
這個管理系統在報警出發后,自動開出罰單,報警的觸發基于像斷路器或者過度的電量水平這樣的問題,員工隨后可以對這個罰單做出相應。另一個員工同時追蹤這個罰單的進度。“這個系統為我們的客戶提供了另一個層級的保護,”他說,值得注意的是Terremark的云服務水平協議沒有其自己的DCIM就不支持。
數據中心和網絡監控是云服務水平協議后盾
盡管數據中心監控能夠協助云提供商遵守其對客戶的承諾,但是云端也有也一些其他不同的元素,從服務器到數據中心環境到網絡,都需要小心監控,Amy DeCarlo表示,她是Current Analysis安全和數據中心服務的首席分析師。“不只是數據中心需要云提供商監控,他們還需要監控網絡,”DeCarlo說道。
一些廠商,像Verizon或者AT&T奢侈的使用著自己的網絡,而Rackspace使用的就變成了第三方網絡。不管他們使用的是什么模型,所有云提供商應該對其網絡可見,密切關注網絡性能,以便支持云服務水平協議,她指出。
數據中心監控為云提供商理解他們是否符合其服務水平協議提供了重要機制,Sam Barnett對此表示贊同,他是Infonetics Research數據中心和云指導分析師。云提供商可以采取不同的方法監控,取決于他們的客戶群和他們所提供的服務。“提供商可能選擇在虛擬機上部署應用性能監控,網絡狀態監控和能效或者計算監控,”他說,并指出提供商必須基于他們的有效監控認真處理其云服務水平協議。
盡管監控技術能夠協助云提供商向其客戶證明其服務水平協議,但是對很多提供商來說這個領域仍舊讓人犯難。對于大多數提供商而言,提供100%的云服務水平協議仍舊尚早。