添加應(yīng)用性能監(jiān)控工具實現(xiàn)系統(tǒng)管理
企業(yè)把應(yīng)用遷移至云計算架構(gòu)后,需要面臨數(shù)據(jù)中心性能監(jiān)控與管理的新挑戰(zhàn),包括支持應(yīng)用性能。
隨著云計算越來越流行,數(shù)據(jù)中心系統(tǒng)管理逐漸從只是簡單地考慮虛擬機(jī)狀態(tài)提高到關(guān)注應(yīng)用程序性能監(jiān)控和管理(APM),Gartner公司的IT運維管理研究總監(jiān)Kowall認(rèn)為:“許多監(jiān)控軟件的立意依舊停留在關(guān)注架構(gòu)而不是應(yīng)用,但這一現(xiàn)狀將要改變了。”
應(yīng)用性能監(jiān)控工具需要能夠協(xié)助數(shù)據(jù)中心管理者們判斷應(yīng)用是否以最優(yōu)的方式部署在當(dāng)前環(huán)境上,假設(shè)現(xiàn)在正使用資源共享型——如云架構(gòu)——其中某個工作負(fù)載的性能波動都可能影響到整臺硬件上的其他負(fù)載,Kowall說。應(yīng)用程序性能十分重要,而且用戶體驗是所有數(shù)據(jù)中心性能指標(biāo)中最重要的一項。
組織需要將基礎(chǔ)設(shè)施監(jiān)控戰(zhàn)略目標(biāo)設(shè)定為“無論現(xiàn)狀如何,都要朝著更先進(jìn)的方向發(fā)展,”他說。包括監(jiān)控子系統(tǒng),一個事件控制臺和APM工具,用于支持多種監(jiān)控技術(shù)。這樣可以降低培訓(xùn)和其他因為擴(kuò)展監(jiān)控技術(shù)而帶來的費用。
同樣的,獲得并保持與程序開發(fā)者的聯(lián)系,以及了解他們預(yù)期,還有關(guān)于云計算設(shè)施監(jiān)控的相關(guān)目標(biāo),Kowall說。
APM的問題
用戶期望和目標(biāo)是遷移到虛擬化和云架構(gòu)中最重要的需求。GlassHouse Technologies公司是一家提供企業(yè)級云計算和存儲服務(wù)提供商。
“按照我的經(jīng)驗,我們只有很少一部分用戶使用第三方工具進(jìn)行深入的監(jiān)控,”GlassHouse虛擬化實踐專家Mike Valuck說。
他補(bǔ)充說,那些進(jìn)行實踐的公司,擁有某個專業(yè)的團(tuán)隊來觀察和理解工具將復(fù)雜的工作拆分并細(xì)化。他們觀察所有的點號和破折號。那是一群專業(yè)人士。實際上,大部分公司都會使用現(xiàn)成的應(yīng)用程序性能監(jiān)控工具,并配置來滿足基礎(chǔ)使用需求,比如簡單的故障告警監(jiān)控和通知郵件發(fā)送等。而就告警而言,告警和響應(yīng)方案往往都不是很成熟。如果希望了解Cisco告警的七種類型,那樣需要雇傭一批專業(yè)人事,而大部分公司不會考慮這樣解決方案。
并不是IT專家對應(yīng)用程序監(jiān)控不感興趣,而是需要花費大量時間與精力來實現(xiàn),Valuck強(qiáng)調(diào)。“那些在監(jiān)控上多下功夫的人員會更容易掌握,但是整理的報表內(nèi)容并沒有那么深入,”他說。雖然他們可能希望知道為什么某個數(shù)據(jù)庫事務(wù)花費了很長時間,但直到專家們發(fā)現(xiàn)并深入分析之前,都無法通過監(jiān)控解決復(fù)雜的問題。無論監(jiān)控工具怎樣運用,都是在運行環(huán)境之外;它們無法了解更深入程序的內(nèi)容。“這就是為何我們有時候會發(fā)現(xiàn)用戶同時使用了5種不同的監(jiān)控工具,并且當(dāng)你問起他們這么做的原因時,他們通常會說,‘哦,我們需要查看一些報表,’”Valuck解釋道。
他發(fā)現(xiàn)許多公司仍舊在監(jiān)控和報告可用性問題,“要么是帶寬,要么是磁盤容量或者CPU使用率。”按照傳統(tǒng)監(jiān)控來說,容量等問題通常是用戶所關(guān)注的,而隨著云計算這種架構(gòu)的應(yīng)用,需要設(shè)計滿足用戶們計算高峰期時的負(fù)載。“就如亞馬遜一樣,用戶付費購買了指定數(shù)量的處理器或者一定容量的內(nèi)存,甚至還可能購買了I/O。從經(jīng)濟(jì)的角度看,并沒有很多在性能上具備嚴(yán)格監(jiān)控和審計的方法,除了某些情況下,涉及到資金相關(guān)業(yè)務(wù),真的需要精確到每個事務(wù)要能非常迅速地處理完成,譬如股票交易,”他解釋說。
大部分虛擬化或者云計算提供商,所提供給用戶的性能數(shù)據(jù)都與現(xiàn)實存在偏差。這種趨勢的一個例外是某家航空公司,他們寫了一個腳本來讓其可以訪問其他航空公司的網(wǎng)站并獲得“需要什么機(jī)票”一類的信息。這是針對外部的競爭活動。
應(yīng)用程序性能監(jiān)控工具可以展示公司自己擁有的基礎(chǔ)設(shè)施是否掛起,而且有些工具還提供了輕量級的網(wǎng)站性能監(jiān)控。“如果這些功能都被企業(yè)充分利用,那就已經(jīng)足夠了,”Copas說。
對私有云或者私有基礎(chǔ)設(shè)施來說,無論是否虛擬化,監(jiān)控和測量所獲得的好處并不會改變數(shù)據(jù)中心內(nèi)部模型,他說。而且當(dāng)企業(yè)開始運作私有云,同樣還需要監(jiān)控,這是基礎(chǔ)設(shè)施的重要部分。
“當(dāng)你轉(zhuǎn)向第三方或云服務(wù)提供商,可能會要求他們提供監(jiān)控工具,或者需要某些機(jī)制來確保自己所獲得的環(huán)境資源。而且當(dāng)開始投入使用后,會更關(guān)注端到端,事務(wù)處理類型的性能監(jiān)控,而不是只看單獨的性能狀態(tài)或簡單將其求和,”Copas解釋,“我已經(jīng)見過不少用戶這樣做,他們在多少程度上都存在沒有監(jiān)控機(jī)制或者沒有實際執(zhí)行必要等級的監(jiān)控事務(wù)。”
當(dāng)應(yīng)用基于WEB以及內(nèi)部使用時,收集端到端事務(wù)處理性能數(shù)據(jù)會比收集來自云架構(gòu)的更加容易。“有許多應(yīng)用程序可以為測量WEB性能提供服務(wù),因為你可以只通過查看到達(dá)WEB服務(wù)器的HTML,并測量首次點擊到最后操作的效果,”他說。通過對比,譬如采用內(nèi)部SQL數(shù)據(jù)庫服務(wù)器,“這就需要去深入研究事務(wù)日志,相對來說會更困難。”
應(yīng)用程序監(jiān)控對用戶的好處
Copas設(shè)想最終用戶會更加重視未來的云性能監(jiān)控。雖然傳統(tǒng)數(shù)據(jù)中心已經(jīng)試圖將監(jiān)控技術(shù)推廣到每個組件中,這是個具有單向優(yōu)勢而不是一個統(tǒng)一的觀點。“存儲工具、備份監(jiān)控工具、網(wǎng)絡(luò)工具——所有這些類型的性能監(jiān)控工具都十分有意思,但對云來說卻還不夠。在某一天,也許上述的東西我們不再在乎。只有性能監(jiān)控會最終轉(zhuǎn)換成美元,產(chǎn)生效益,”他說。
Forrester Research公司的分析師Glenn O'Donnell建議以長遠(yuǎn)的眼觀看問題,將目光集中在監(jiān)控上,會發(fā)現(xiàn)監(jiān)控所帶來的收益不足以說明其是十分必要的。“前端應(yīng)該由那些更優(yōu)秀的規(guī)劃和設(shè)計來實現(xiàn);APM和其他監(jiān)控工具需要放在后端發(fā)揮價值,”他說。
不幸的是,規(guī)劃是比科學(xué)更加神秘的藝術(shù),因為它是由那些先覺者——類似大祭師才能推動的技術(shù),沒有人天生就是優(yōu)秀的規(guī)劃者。“這是人類行為中在各個領(lǐng)域都存在的問題,”O’Donnell說。